Игра New World сжигает GPU, а Google Imagen побеждает DALL-E: главные новости ML

Yannic Kilcher 9,5 тыс. 13 мин 4 мин 02.08.2021
Главное

В новом выпуске новостей машинного обучения на канале Янника Кильчера произошла временная ротация: роль ведущего взял на себя Саньям Бхутани. В центре внимания оказались не только программные достижения, но и аппаратные катастрофы. Главными темами выпуска стали скандал вокруг игры New World от Amazon, уничтожающей топовые видеокарты, решение OpenAI распустить подразделение робототехники и впечатляющие успехи Google в генерации реалистичных изображений.

🎮 Когда игры убивают «железо»: инцидент с New World 1:43

Одной из самых обсуждаемых новостей за пределами чистого ML стал запуск многопользовательской игры New World от Amazon. Однако проект привлек внимание не геймплеем, а тем, что он в буквальном смысле выводит из строя флагманские видеокарты .

Основные факты инцидента:

По мнению Саньяма Бхутани, эта ситуация важна и для сообщества машинного обучения, поскольку GPU являются критически важным ресурсом для обучения моделей. Любые перебои в поставках или проблемы с надежностью флагманских чипов напрямую влияют на работу специалистов по данным .

🤖 OpenAI покидает арену робототехники 2:55

Громким событием стал официальный уход OpenAI из сферы исследований физической робототехники. Компания решила распустить свою профильную группу .

Саньям Бхутани выделяет несколько причин этого решения:

  1. Проблема данных. В отличие от языковых моделей, которые обучаются на колоссальных объемах текста из интернета, робототехника страдает от нехватки данных из реального мира .
  2. Сложность среды. Моделирование физических взаимодействий требует огромных ресурсов, а прогресс в этой области идет медленнее, чем в цифровых средах.
  3. Смена фокуса. По мнению ведущего, OpenAI решила сконцентрироваться на том, что у них получается лучше всего — на программном обеспечении и больших языковых моделях (LLM) .

Несмотря на это, Бхутани отмечает, что прогресс в индустрии продолжается. В качестве примера он приводит достижения других компаний, демонстрирующих роботов, способных выполнять сложные движения и танцы, что выглядит впечатляюще, хотя и остается сложной инженерной задачей .

🌌 Машинное обучение на службе науки: от Марса до медицины 5:09

Технологии ИИ находят все более глубокое применение в фундаментальных науках и повседневной жизни. Саньям Бхутани выделил несколько ключевых направлений .

Космические исследования и NASA: Специалисты NASA начали использовать алгоритмы для анализа изображений, полученных с Марса . Теперь пользователи могут загружать снимки и получать детализированную информацию о ландшафте и особенностях поверхности Красной планеты . По словам ведущего, это делает науку более доступной для широкой аудитории.

Сельское хозяйство: ИИ проникает в агротехнологии через системы компьютерного зрения.

Медицинская визуализация: В области здравоохранения ИИ становится важным помощником врача. Бхутани подчеркивает, что нейросети обучаются анализировать сложные медицинские изображения, такие как МРТ и КТ-снимки .

🧬 Революция в биологии и новые вызовы для роботов 9:36

Одним из величайших прорывов в истории науки Саньям Бхутани называет развитие проекта AlphaFold .

Работа с протеинами:

Бенчмарк BEHAVIOR: Для тех, кто продолжает заниматься робототехникой, был представлен новый вызов — BEHAVIOR challenge . Это набор тестов, имитирующих повседневные задачи в домашней среде: уборка, ходьба, взаимодействие с предметами. Цель — создать агентов, обладающих «здравым смыслом» и способных ориентироваться в хаосе реальной жизни, а не только в стерильных условиях лабораторий .

🖼️ Google Imagen: новый уровень генерации изображений 11:40

В завершение выпуска Саньям обсудил успехи компании Google в области генерации изображений по текстовому описанию (Text-to-Image). Новая модель под названием Imagen продемонстрировала результаты, которые многие эксперты сочли более впечатляющими, чем у нашумевшей DALL-E от OpenAI .

Ключевые особенности Imagen, по мнению Бхутани:

Ведущий резюмирует, что мы находимся в эре стремительного развития генеративного искусства, где границы между реальностью и созданным ИИ изображением становятся все более размытыми.

💬 Цитаты

«OpenAI решила распустить свою группу робототехники, потому что прогресс в этой области сдерживается отсутствием данных из реального мира.»

Саньям Бхутани 03:15

«Это огромный прорыв в истории человечества — база данных стольких белков может быть невероятно полезна для понимания самой жизни.»

Саньям Бхутани 10:02
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
GPU
Графический процессор, используемый как для игр, так и для параллельных вычислений в машинном обучении.
LLM
Большие языковые модели, такие как GPT, обучаемые на огромных массивах текстовых данных.
AlphaFold
Система искусственного интеллекта от DeepMind, предсказывающая трехмерную структуру белка по его аминокислотной последовательности.
Imagen
Модель искусственного интеллекта от Google для генерации высокореалистичных изображений по текстовому описанию.
📊 Цифры
🗓 Хронология
  1. Июль 2021 Выход игры New World и начало массовых отчетов о поломках GPU.
  2. 2021 OpenAI официально прекращает работу своего подразделения физической робототехники.
⚖️ Другая сторона
Искусственный интеллект OpenAI Google Imagen AlphaFold GPU Саньям Бхутани