В выпуске ML News Янник Килчер (Yannic Kilcher) обсуждает ключевые события в мире машинного обучения и искусственного интеллекта. В центре внимания — предстоящая конференция NVIDIA GTC'21, поглощение симулятора MuJoCo компанией DeepMind и инновационное прогнозирование формул в Google Таблицах.
🎤 Конференция NVIDIA GTC'21 0:14
Янник Килчер анонсирует конференцию NVIDIA GTC'21, которая пройдёт с 8 по 11 ноября 2021 года. Ведущий отмечает, что мероприятие стало важным событием для сообщества глубокого обучения благодаря обширной программе.
- Ключевой доклад: Участники ожидают выступление Дженсена Хуанга. Янник с иронией вспоминает предыдущий доклад, где NVIDIA использовала рендеринг самого спикера, что вызвало неоднозначную реакцию.
- Omniverse: Ожидается, что одной из главных тем станет платформа NVIDIA Omniverse (находящаяся в бета-тестировании) — система для рендеринга в реальном времени, основанная на технологии Pixar Universal Scene Description.
- Масштаб события: Программа включает более 500 сессий, из которых 15 посвящены PyTorch и 12 — TensorFlow.
- Обучение: Помимо докладов, запланированы интерактивные воркшопы под руководством инструкторов, например, по созданию приложений NLP на базе трансформеров.
Янник называет конференцию крайне значимой для индустрии и напоминает зрителям, что участие бесплатно, а по его реферальной ссылке можно поучаствовать в розыгрыше видеокарты NVIDIA GeForce RTX 3090.
🤖 DeepMind открывает MuJoCo 5:30
DeepMind приобрела и перевела в формат open source симулятор MuJoCo, который является стандартом в области робототехники и обучения с подкреплением.
- Значение: До этого момента MuJoCo был проприетарным и платным программным обеспечением, что создавало барьеры для исследователей.
- Преимущества: По словам Янника, MuJoCo предлагает оптимальный баланс между точностью физической симуляции (включая гироскопические эффекты) и скоростью, необходимой для обучения агентов.
- Мотивы: Ведущий предполагает, что этот шаг может быть продиктован требованиями публикаций в журнале Nature, которые обязывают исследователей открывать исходный код проектов.
💻 Обновления фреймворков и инструментов 7:29
Янник делает обзор последних релизов, которые упрощают разработку и эксперименты:
- PyTorch 1.10: Основное нововведение — API для CUDA Graphs. Теперь разработчики могут задавать целые графы операций над ядрами CUDA через одну инструкцию CPU, что значительно эффективнее, чем вызов каждой операции по отдельности. Также появился модуль
torch.special(аналогscipy.special) и параметрnn.Module, позволяющий гибко заменять компоненты (например, нормализацию) без необходимости переписывать весь модуль. - ControlFlag (Intel Labs): Система самообучения, которая анализирует код и выявляет «необычные» паттерны, часто указывающие на ошибки, не опираясь на размеченные наборы данных.
- Selina (Facebook Research): Легковесная библиотека для создания сложных моделей принятия последовательных решений, включая агентов обучения с подкреплением (RL).
- YData Synthetic: Библиотека для генерации синтетических табличных и временных данных, что особенно полезно в условиях дефицита реальных данных или проблем с приватностью.
- Aim: Экспериментальный open-source трекер для ML-проектов, решающий проблему масштабируемости при отслеживании большого количества экспериментов.
📊 ИИ в Google Таблицах 9:04
Google внедрила функцию предсказания формул в свои электронные таблицы, основанную на исследовательской работе «Spreadsheet Coder».
- Как это работает: Система анализирует контекст: заголовки столбцов и строк, а также значения в ячейках. Например, если в заголовке написано «Total», модель предложит функцию
SUM. - Технологическая база: Архитектура включает кодировщики BERT для строк и столбцов, свёрточные слои и декодер LSTM.
- Результативность: По утверждению Янника, система достигает точности около 50% в предсказании формул, что является выдающимся достижением для переноса фундаментальных исследований в реальный продукт.
🧠 Другие примечательные разработки 11:28
- Hand Tracking.io: Демонстрация отслеживания движений рук непосредственно в браузере, использующая жесты для управления элементами интерфейса.
- Robust Bench: Стандартизированный бенчмарк для проверки защищённости нейросетей от состязательных атак (adversarial robustness), включающий «зоопарк» из более чем 80 предварительно обученных моделей.
- Waymo и тупики: Янник с долей иронии упоминает видео из Сан-Франциско, где автомобили Waymo постоянно заезжают в тупик, разворачиваются и уезжают, что, вероятно, указывает на ошибку в навигационных картах или алгоритмах исследования городской среды.
- Blue River Technology: Компания, стремящаяся стать «Boston Dynamics в сельском хозяйстве». Янник отмечает потенциал использования ИИ для более точного внесения удобрений, хотя и подшучивает над тем, что сближение роботов и природы «исторически ни к чему хорошему не приводило».