Новости машинного обучения: Blind Chess, нейросети в логистике и «умные» подарки 0:00
Неделя в мире машинного обучения выдалась относительно спокойной, что позволило эксперту и ведущему канала Яннику Килчеру (Yannic Kilcher) обратить внимание на более лёгкие, но не менее интересные темы. В сегодняшнем выпуске обсуждаются инновации в шахматах, применение графовых нейросетей для предсказания трафика и новые подходы к созданию подарков с помощью ИИ.
♟️ Reconnaissance Blind Chess: шахматы с «туманом войны» 0:27
На конференции NeurIPS 2021 представлен новый вариант шахмат — Reconnaissance Blind Chess. Его ключевое отличие от классической игры заключается в отсутствии полной видимости поля, что роднит его с компьютерными стратегиями с «туманом войны».
Основные правила:
- Двухэтапный ход: Каждый ход игрока состоит из двух действий — сначала «разведка» (sensing) участка доски размером 3x3 клетки, а затем выполнение самого шахматного хода.
- Цель игры: Понятие «шаха» отсутствует, игра заканчивается, когда фигура короля оказывается захвачена.
- Тактическая глубина: Игроки должны не только планировать свои ходы, но и моделировать знания противника о своей позиции, пытаясь предугадать, где тот проводит разведку.
- Сюрприз-атаки: Возможность делать ходы, которые противник не успел отскаутить, позволяет проводить неожиданные атаки.
По словам Янника Килчера, игра доступна для тестирования онлайн — можно сразиться с ботом или другим игроком. Ведущий отмечает, что, несмотря на сложность, это отличный инструмент для отработки навыков создания ИИ-агентов.
🚦 Графовые нейросети и оптимизация трафика 4:50
Крупная коллаборация с участием DeepMind, Waymo, Google, Amazon и Facebook AI позволила использовать Graph Neural Networks (графовые нейросети) для улучшения предсказания времени прибытия (ETA) в реальном времени.
- Принцип работы: Дорожные пути сегментируются, а графовые нейросети интегрируют «живую» информацию для точного прогнозирования времени прибытия.
- Технические хитрости: Разработчики использовали мета-градиенты для управления гиперпараметрами, но, как отмечает Килчер, основной успех проекта — это качественная инженерная работа.
- Результаты: Внедрение системы в Google Maps привело к существенному росту точности предсказаний, в некоторых случаях улучшение достигает 50%.
🛠️ Новые библиотеки для обучения и физики 5:58
В индустрии появились новые инструменты, упрощающие исследования в области робототехники и биомеханики:
- Isaac Gym: Высокопроизводительная физическая симуляция на базе GPU от NVIDIA. Позволяет проводить исследования в области обучения роботов и обучения с подкреплением непосредственно на акселераторах, что значительно ускоряет процесс.
- Nimble Physics: Библиотека, предоставляющая дифференцируемую модель человеческого тела. Она позволяет изменять параметры модели, сохраняя высокую точность симуляции, что открывает новые возможности в биомеханике.
- LVIS (Large Vocabulary Instance Segmentation): Датасет для сегментации объектов с большим словарем категорий. Особая сложность заключается в работе с редкими категориями («длинный хвост» данных).
- BEHAVIOR (Stanford University): Бенчмарк для обучения роботов повседневным домашним делам в виртуальной среде. Особенность — грамматический подход к генерации сцен, что создает практически бесконечное количество вариаций сред.
🦾 Cerebras и будущее больших моделей 10:19
Компания Cerebras разработала чип-кластер, способный поддерживать нейросеть со 120 триллионами соединений — это примерно в 100 раз больше, чем позволяют текущие решения.
- Стратегия: В отличие от кластеров GPU, соединенных через InfiniBand, Cerebras делает ставку на гигантские чипы.
- Проблемы: Такие системы требуют гораздо более высокой отказоустойчивости, так как невозможно просто заменить один вышедший из строя компонент.
- Статус: По словам руководителя проекта Эндрю Фельдмана (Andrew Feldman), инфраструктура готова, но модель, способная эффективно задействовать такие ресурсы, еще не создана.
🗣️ Репликация голоса Вэла Килмера 12:05
Стартап Sonantic использовал ИИ для воссоздания голоса Вэла Килмера (Val Kilmer), который утратил способность говорить после операции из-за рака горла.
- Мнения экспертов: Технология дает надежду людям, потерявшим голос. Однако, как отмечает актер озвучивания Джей Бриттон (Jay Britton), существуют риски несанкционированного использования лицензированного голоса для контента, который актер может не поддерживать.
- Позиция ведущего: Янник Килчер полагает, что ситуация схожа с рынком стоковых фотографий: индустрии просто необходимо адаптироваться к новым возможностям, а не запрещать технологию.
🎁 ИИ как советник по подаркам 14:16
Сервисы рекомендаций подарков на базе ИИ, такие как Gossby, становятся все более популярными. Янник Килчер отмечает, что, несмотря на критику алгоритмов, ИИ часто справляется с задачей подбора подарка лучше человека, так как способен анализировать данные и предлагать более персонализированные варианты. Ведущий протестировал аналогичный инструмент для YouTube-каналов, отметив, что алгоритмы иногда ошибаются, пытаясь угадать интересы пользователя на основе недавних видео, но в целом это направление выглядит перспективным.