Дэвид Ха: «Интеллект — это результат ограничений, а не избытка ресурсов»

The TWIML AI Podcast 1,1 тыс. 1 ч 3 мин 5 мин 11.11.2021
Главное

В новом выпуске The TWIML AI Podcast исследователь Google Brain Дэвид Ха (David Ha) рассказал о том, как фундаментальные ограничения биологических систем и искусственные «узкие места» в архитектуре нейросетей способствуют появлению более устойчивого и адаптивного интеллекта. По мнению гостя, избыток вычислительных ресурсов в современном машинном обучении может мешать развитию генерализации, в то время как дефицит и структурные барьеры заставляют алгоритмы находить суть явлений.

🧠 Биологическое вдохновение и парадокс ресурсов 2:35

Дэвид Ха отмечает, что современное глубокое обучение (Deep Learning) движется по пути масштабирования: больше данных, больше электричества, больше вычислительных мощностей . Однако биологический интеллект эволюционировал в условиях жесткой нехватки ресурсов. Эволюция отбирает системы, способные делать «большее с меньшим», что роднит биологию с процессом творчества, где минимализм часто ведет к более выразительным результатам .

В Google Brain Дэвид наблюдает два полюса исследований:

По мнению Ха, для прогресса ИИ необходим баланс: большие модели должны уметь работать на маленьких чипах с низким энергопотреблением .

📉 «Узкие места» как катализатор абстрактного мышления 5:15

Гость утверждает, что человеческое сознание и язык возникли как результат физиологических и когнитивных ограничений (bottlenecks). Мы передаем сложные концепции через узкий канал связи — слова, жесты или рисунки, что заставляет мозг формировать абстрактные представления .

В своих ранних работах Дэвид Ха применял принцип ограничений к генеративным моделям:

Дэвид полагает, что изучение того, как люди создают минималистичные репрезентации (из-за ограничений в виде рук, палок и поверхности пещер), помогает понять наши собственные индуктивные смещения (inductive biases) и перенести их в ИИ .

🎮 World Models: обучение внутри нейронного симулятора 12:07

Одним из самых известных проектов Дэвида Ха стала работа «World Models» (Модели мира), созданная совместно с Юргеном Шмидтхубером .

Ключевые механизмы World Models:

  1. Вариационный автокодировщик (VAE): сжимает визуальный поток игры в низкоразмерное латентное пространство (информационное «узкое место») .
  2. Рекуррентная нейросеть (RNN): предсказывает будущее состояние этого латентного пространства на основе текущих действий .
  3. Контроллер: очень простая модель, которая принимает решения, имея на входе всего около 200 чисел (скрытое состояние RNN и вектор VAE), вместо миллионов пикселей .

Результатом этого подхода стала первая нейросеть, успешно прошедшая задание Car Racing в OpenAI Gym . По словам Ха, оптимизировать политику агента гораздо проще, когда данные уже очищены от шума и представлены в виде компактной абстракции. Этот метод лег в основу более поздних эффективных алгоритмов, таких как SimPLe (2019 год) и Dreamer .

👀 Жесткое внимание и «интенциональная слепота» 23:13

В проекте «Neuroevolution of Self-Interpretable Agents», выполненном под руководством Юджина Танга, команда Ха заменила латентное сжатие механизмом «жесткого внимания» (Hard Attention) .

Основные особенности метода:

Преимущество такого ограничения — экстраординарная устойчивость. Если в игре Doom или Car Racing изменить цвет фона или добавить случайные объекты, агент с Hard Attention продолжает работать (zero-shot transfer), так как он просто не «смотрит» на неважные изменения . Обычные модели в таких условиях часто выходят из строя.

🧬 Нейроэволюция и архитектурный поиск 31:23

Дэвид Ха активно использует эволюционные алгоритмы (эволюционные стратегии, генетические алгоритмы) вместо градиентного спуска в задачах, где функции не дифференцируемы .

Проект Weight Agnostic Neural Networks (WANN):

В робототехнике, по словам гостя, эволюционные алгоритмы (такие как CMA-ES или Augmented Random Search) популярны из-за их объяснимости и эффективности для небольших контроллеров объемом в 1000–10000 параметров .

👅 Сенсорная замена и перемешивание входов 41:43

Последние исследования гостя посвящены способности агентов адаптироваться к изменению сенсоров. Ха приводит в пример опыты Пола Бах-и-Риты :

  1. Слепые люди учились «видеть» через тактильные сигналы от камеры, подаваемые на решетку электродов на спине или языке .
  2. Через несколько недель мозг начинал интерпретировать покалывания как визуальные образы .

Команда Ха создала агент «Sensory Neuron as a Transformer». Они скармливали нейросети данные, порядок которых постоянно перемешивался (shuffled observations) . Благодаря использованию механизмов, схожих с Set Transformer, агент стал инвариантным к порядку входных данных .

Удивительным открытием стало то, что такой агент может работать, даже если данные перемешиваются прямо во время игрового эпизода каждые 100 шагов . Кроме того, модель научилась игнорировать лишний шум: если ей дать 5 нужных сигналов и 15 шумовых в случайном порядке, она сама находит важные связи .

🐜 Будущее: коллективный интеллект и самоорганизация 1:00:10

Дэвид Ха выразил восхищение работами своего коллеги Александра Мордвинцева над нейронными клеточными автоматами . В будущем Ха планирует отойти от монолитных нейросетей в сторону коллективного интеллекта.

Его видение включает:

По мнению гостя, такой подход может решить хронические проблемы обучения с подкреплением — хрупкость алгоритмов и их плохую способность к обобщению .

💬 Цитаты

«Эволюция всегда отбирает системы, которые способны делать большее с меньшим ресурсом.»

Дэвид Ха 3:40

«Мы передаем концепции через узкие каналы: язык, жесты, рисунки. Это и есть причина возникновения интеллекта.»

Дэвид Ха 6:08
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Латентное пространство
Сжатое представление данных, в котором скрыты только самые важные характеристики объекта.
Нейроэволюция
Метод обучения нейросетей с помощью эволюционных алгоритмов (изменение структуры и весов через мутации и отбор).
Индуктивное смещение
Набор априорных допущений в алгоритме, которые помогают ему обобщать данные за пределами обучающей выборки.
Zero-shot transfer
Способность модели успешно выполнять задачу в новых условиях без дополнительного дообучения.
📊 Цифры
🗓 Хронология
  1. 2014 Публикация статьи Яна Гудфеллоу о GAN (генеративно-состязательных сетях)
  2. 2016 Дэвид Ха присоединяется к Google Brain в рамках программы Research Residency
  3. 2018 Публикация работы World Models совместно с Юргеном Шмидтхубером
  4. 2019 Появление алгоритма SimPLe для обучения агентов на основе моделей среды
⚖️ Другая сторона
Искусственный интеллект David Ha Google Brain World Models Neuroevolution Hard Attention