# Янник Килчер: NVIDIA GTC'21, успех MuJoCo и ИИ в Google Таблицах

Источник: https://www.youtube.com/watch?v=U8Rmfb8aZXE
Канал: Yannic Kilcher
Опубликовано: 29.10.2021

---

В выпуске *ML News* Янник Килчер (Yannic Kilcher) обсуждает ключевые события в мире машинного обучения и искусственного интеллекта. В центре внимания — предстоящая конференция NVIDIA GTC'21, поглощение симулятора MuJoCo компанией DeepMind и инновационное прогнозирование формул в Google Таблицах.

## 🎤 Конференция NVIDIA GTC'21
[[JUMP:00:14]]

Янник Килчер анонсирует конференцию NVIDIA GTC'21, которая пройдёт с 8 по 11 ноября 2021 года. Ведущий отмечает, что мероприятие стало важным событием для сообщества глубокого обучения благодаря обширной программе.

* **Ключевой доклад:** Участники ожидают выступление Дженсена Хуанга. Янник с иронией вспоминает предыдущий доклад, где NVIDIA использовала рендеринг самого спикера, что вызвало неоднозначную реакцию.
* **Omniverse:** Ожидается, что одной из главных тем станет платформа NVIDIA Omniverse (находящаяся в бета-тестировании) — система для рендеринга в реальном времени, основанная на технологии Pixar Universal Scene Description.
* **Масштаб события:** Программа включает более 500 сессий, из которых 15 посвящены PyTorch и 12 — TensorFlow.
* **Обучение:** Помимо докладов, запланированы интерактивные воркшопы под руководством инструкторов, например, по созданию приложений NLP на базе трансформеров.

Янник называет конференцию крайне значимой для индустрии и напоминает зрителям, что участие бесплатно, а по его реферальной ссылке можно поучаствовать в розыгрыше видеокарты NVIDIA GeForce RTX 3090.

## 🤖 DeepMind открывает MuJoCo
[[JUMP:5:30]]

DeepMind приобрела и перевела в формат open source симулятор MuJoCo, который является стандартом в области робототехники и обучения с подкреплением.

* **Значение:** До этого момента MuJoCo был проприетарным и платным программным обеспечением, что создавало барьеры для исследователей.
* **Преимущества:** По словам Янника, MuJoCo предлагает оптимальный баланс между точностью физической симуляции (включая гироскопические эффекты) и скоростью, необходимой для обучения агентов.
* **Мотивы:** Ведущий предполагает, что этот шаг может быть продиктован требованиями публикаций в журнале *Nature*, которые обязывают исследователей открывать исходный код проектов.

## 💻 Обновления фреймворков и инструментов
[[JUMP:7:29]]

Янник делает обзор последних релизов, которые упрощают разработку и эксперименты:

1.  **PyTorch 1.10:** Основное нововведение — API для CUDA Graphs. Теперь разработчики могут задавать целые графы операций над ядрами CUDA через одну инструкцию CPU, что значительно эффективнее, чем вызов каждой операции по отдельности. Также появился модуль `torch.special` (аналог `scipy.special`) и параметр `nn.Module`, позволяющий гибко заменять компоненты (например, нормализацию) без необходимости переписывать весь модуль.
2.  **ControlFlag (Intel Labs):** Система самообучения, которая анализирует код и выявляет «необычные» паттерны, часто указывающие на ошибки, не опираясь на размеченные наборы данных.
3.  **Selina (Facebook Research):** Легковесная библиотека для создания сложных моделей принятия последовательных решений, включая агентов обучения с подкреплением (RL).
4.  **YData Synthetic:** Библиотека для генерации синтетических табличных и временных данных, что особенно полезно в условиях дефицита реальных данных или проблем с приватностью.
5.  **Aim:** Экспериментальный open-source трекер для ML-проектов, решающий проблему масштабируемости при отслеживании большого количества экспериментов.

## 📊 ИИ в Google Таблицах
[[JUMP:9:04]]

Google внедрила функцию предсказания формул в свои электронные таблицы, основанную на исследовательской работе «Spreadsheet Coder».

* **Как это работает:** Система анализирует контекст: заголовки столбцов и строк, а также значения в ячейках. Например, если в заголовке написано «Total», модель предложит функцию `SUM`.
* **Технологическая база:** Архитектура включает кодировщики BERT для строк и столбцов, свёрточные слои и декодер LSTM.
* **Результативность:** По утверждению Янника, система достигает точности около 50% в предсказании формул, что является выдающимся достижением для переноса фундаментальных исследований в реальный продукт.

## 🧠 Другие примечательные разработки
[[JUMP:11:28]]

* **Hand Tracking.io:** Демонстрация отслеживания движений рук непосредственно в браузере, использующая жесты для управления элементами интерфейса.
* **Robust Bench:** Стандартизированный бенчмарк для проверки защищённости нейросетей от состязательных атак (adversarial robustness), включающий «зоопарк» из более чем 80 предварительно обученных моделей.
* **Waymo и тупики:** Янник с долей иронии упоминает видео из Сан-Франциско, где автомобили Waymo постоянно заезжают в тупик, разворачиваются и уезжают, что, вероятно, указывает на ошибку в навигационных картах или алгоритмах исследования городской среды.
* **Blue River Technology:** Компания, стремящаяся стать «Boston Dynamics в сельском хозяйстве». Янник отмечает потенциал использования ИИ для более точного внесения удобрений, хотя и подшучивает над тем, что сближение роботов и природы «исторически ни к чему хорошему не приводило».