Игра New World сжигает GPU, а Google Imagen побеждает DALL-E: главные новости ML

В новом выпуске новостей машинного обучения на канале Янника Кильчера произошла временная ротация: роль ведущего взял на себя Саньям Бхутани. В центре внимания оказались не только программные достижения, но и аппаратные катастрофы. Главными темами выпуска стали скандал вокруг игры New World от Amazon, уничтожающей топовые видеокарты, решение OpenAI распустить подразделение робототехники и впечатляющие успехи Google в генерации реалистичных изображений.

🎮 Когда игры убивают «железо»: инцидент с New World 1:43

Одной из самых обсуждаемых новостей за пределами чистого ML стал запуск многопользовательской игры New World от Amazon. Однако проект привлек внимание не геймплеем, а тем, что он в буквальном смысле выводит из строя флагманские видеокарты .

Основные факты инцидента:

Владельцы топовых видеокарт NVIDIA GeForce RTX 3090 столкнулись с поломками оборудования при запуске игры.
Компания EVGA, один из крупнейших поставщиков GPU, официально подтвердила проблему .
Производитель пообещал заменить все вышедшие из строя карты по гарантии и уже начал отгрузку новых единиц пострадавшим пользователям .

По мнению Саньяма Бхутани, эта ситуация важна и для сообщества машинного обучения, поскольку GPU являются критически важным ресурсом для обучения моделей. Любые перебои в поставках или проблемы с надежностью флагманских чипов напрямую влияют на работу специалистов по данным .

🤖 OpenAI покидает арену робототехники 2:55

Громким событием стал официальный уход OpenAI из сферы исследований физической робототехники. Компания решила распустить свою профильную группу .

Саньям Бхутани выделяет несколько причин этого решения:

Проблема данных. В отличие от языковых моделей, которые обучаются на колоссальных объемах текста из интернета, робототехника страдает от нехватки данных из реального мира .
Сложность среды. Моделирование физических взаимодействий требует огромных ресурсов, а прогресс в этой области идет медленнее, чем в цифровых средах.
Смена фокуса. По мнению ведущего, OpenAI решила сконцентрироваться на том, что у них получается лучше всего — на программном обеспечении и больших языковых моделях (LLM) .

Несмотря на это, Бхутани отмечает, что прогресс в индустрии продолжается. В качестве примера он приводит достижения других компаний, демонстрирующих роботов, способных выполнять сложные движения и танцы, что выглядит впечатляюще, хотя и остается сложной инженерной задачей .

🌌 Машинное обучение на службе науки: от Марса до медицины 5:09

Технологии ИИ находят все более глубокое применение в фундаментальных науках и повседневной жизни. Саньям Бхутани выделил несколько ключевых направлений .

Космические исследования и NASA: Специалисты NASA начали использовать алгоритмы для анализа изображений, полученных с Марса . Теперь пользователи могут загружать снимки и получать детализированную информацию о ландшафте и особенностях поверхности Красной планеты . По словам ведущего, это делает науку более доступной для широкой аудитории.

Сельское хозяйство: ИИ проникает в агротехнологии через системы компьютерного зрения.

Алгоритмы способны идентифицировать растения и отличать их от сорняков .
Системы помогают точечно наносить удобрения или гербициды, что значительно повышает эффективность фермерских хозяйств.

Медицинская визуализация: В области здравоохранения ИИ становится важным помощником врача. Бхутани подчеркивает, что нейросети обучаются анализировать сложные медицинские изображения, такие как МРТ и КТ-снимки .

Алгоритмы могут находить патологии, которые сложно заметить человеческому глазу .
По мнению ведущего, это не заменит врачей, но станет мощным инструментом «второго мнения», снижая нагрузку на систему здравоохранения и повышая точность диагностики .

🧬 Революция в биологии и новые вызовы для роботов 9:36

Одним из величайших прорывов в истории науки Саньям Бхутани называет развитие проекта AlphaFold .

Работа с протеинами:

Нейросеть смогла предсказать структуру миллионов белков, что раньше требовало десятилетий лабораторных исследований.
Создание базы данных протеинов дает человечеству беспрецедентный инструмент для понимания жизни на молекулярном уровне и разработки новых лекарств .
Однако Бхутани упоминает и о рисках: подобные технологии теоретически могут быть использованы для создания биологического оружия, что требует осторожности при публикации данных .

Бенчмарк BEHAVIOR: Для тех, кто продолжает заниматься робототехникой, был представлен новый вызов — BEHAVIOR challenge . Это набор тестов, имитирующих повседневные задачи в домашней среде: уборка, ходьба, взаимодействие с предметами. Цель — создать агентов, обладающих «здравым смыслом» и способных ориентироваться в хаосе реальной жизни, а не только в стерильных условиях лабораторий .

🖼️ Google Imagen: новый уровень генерации изображений 11:40

В завершение выпуска Саньям обсудил успехи компании Google в области генерации изображений по текстовому описанию (Text-to-Image). Новая модель под названием Imagen продемонстрировала результаты, которые многие эксперты сочли более впечатляющими, чем у нашумевшей DALL-E от OpenAI .

Ключевые особенности Imagen, по мнению Бхутани:

Невероятный уровень фотореализма.
Точное понимание сложных текстовых запросов, включая абстрактные концепции .
Прогресс в этой области идет настолько быстро, что качество генерации меняется буквально с каждой неделей .

Ведущий резюмирует, что мы находимся в эре стремительного развития генеративного искусства, где границы между реальностью и созданным ИИ изображением становятся все более размытыми.