Янник Кильхер о прибыли DeepMind: «Это похоже на бухгалтерский трюк»

Yannic Kilcher 31,2 тыс. 27 мин 3 мин 20.10.2021
Главное

Новости машинного обучения: от мегамоделей до «прибыли» DeepMind 0:00

Неделя в индустрии ИИ прошла под знаком масштабных достижений, новых инструментов для разработчиков и дискуссий о будущем глобального технологического лидерства. Янник Кильхер (Yannic Kilcher) в своем еженедельном обзоре проанализировал ключевые события, начиная с выхода гигантской языковой модели Microsoft и заканчивая вопросами финансовой устойчивости DeepMind.

🏗 Развитие языковых моделей: Microsoft Megatron-Turing NLG 530B 2:32

Microsoft представила Megatron-Turing NLG 530B — декодерную языковую модель, которая значительно превосходит GPT-3 по количеству параметров.

По мнению Кильхера, несмотря на впечатляющие результаты в zero-shot задачах, вопрос о том, будет ли модель доступна широкому кругу пользователей или останется сугубо академическим упражнением, остается открытым.

🎨 Генеративные модели и компьютерное зрение 5:14

Nvidia представила код и предобученные модели для StyleGAN3 (ранее известной как «alias-free GAN»). Главное отличие от предшественника StyleGAN2 заключается в том, что объекты в генерациях StyleGAN3 не имеют жесткой зависимости от абсолютной позиции в кадре, что позволяет им перемещаться более естественно.

Другие интересные разработки:

🔬 Наука и медицина: AlphaFold и новые материалы 12:34

DeepMind продолжает активно применять ИИ для решения фундаментальных биологических задач:

  1. AlphaFold Multimer: Специализированная версия AlphaFold, предназначенная для предсказания структуры белковых комплексов (взаимодействия нескольких цепей аминокислот), что является гораздо более сложной задачей, чем анализ одиночных белков.
  2. Прогноз экспрессии генов: Использование больших трансформеров для анализа ДНК. Модель предсказывает, как различные модификации ДНК (метилирование, гистоны, регуляторные последовательности) влияют на считывание генов, что позволяет анализировать варианты генома без проведения дорогостоящих экспериментов.

Также Google AI предложил метод использования струйных принтеров для создания комбинаторных смесей оксидов металлов, свойства которых затем анализируются с помощью машинного обучения. Из огромного числа вариантов исследователи выделили 51 перспективную систему, при этом лишь одна из них была ранее подтверждена экспериментально.

💼 Индустрия: Инвестиции, лидерство и «прибыльность» DeepMind 0:16

Финансовый ландшафт ИИ-сектора претерпел значительные изменения:

В разделе геополитики Кильхер прокомментировал заявление ушедшего в отставку руководителя по программному обеспечению Пентагона, который утверждает, что США уже проиграли технологическую войну Китаю. По мнению Кильхера, дискуссии об этике ИИ в США — это способ успокоить определенные общественные группы, в то время как Китай фокусируется исключительно на наращивании мощностей.

💬 Цитаты

«Наша область теперь — это просто мемы.»

Янник Кильхер 09:42

«DeepMind, вышедшая в плюс, может быть скорее бухгалтерским трюком, чем чем-либо еще.»

Янник Кильхер 26:57
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Zero-shot
Способность модели выполнять задачу без предварительного обучения на конкретных примерах этой задачи.
Динамические батчи (Batch size)
Количество обучающих примеров, обрабатываемых нейросетью за один проход до обновления весов модели.
Protein folding (Фолдинг белка)
Процесс приобретения белковой молекулой своей функциональной трехмерной структуры.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Megatron-Turing NLG DeepMind AlphaFold Weights & Biases Nvidia StyleGAN3