Дэвид Ха: «Интеллект — это результат ограничений, а не избытка ресурсов»

В новом выпуске The TWIML AI Podcast исследователь Google Brain Дэвид Ха (David Ha) рассказал о том, как фундаментальные ограничения биологических систем и искусственные «узкие места» в архитектуре нейросетей способствуют появлению более устойчивого и адаптивного интеллекта. По мнению гостя, избыток вычислительных ресурсов в современном машинном обучении может мешать развитию генерализации, в то время как дефицит и структурные барьеры заставляют алгоритмы находить суть явлений.

🧠 Биологическое вдохновение и парадокс ресурсов 2:35

Дэвид Ха отмечает, что современное глубокое обучение (Deep Learning) движется по пути масштабирования: больше данных, больше электричества, больше вычислительных мощностей . Однако биологический интеллект эволюционировал в условиях жесткой нехватки ресурсов. Эволюция отбирает системы, способные делать «большее с меньшим», что роднит биологию с процессом творчества, где минимализм часто ведет к более выразительным результатам .

В Google Brain Дэвид наблюдает два полюса исследований:

Ресурсный подход: создание экстремально больших моделей на гигантских датасетах .
Теоретический подход: работа специалистов по теоретической физике, которые могут практически не использовать компьютерное моделирование, фокусируясь на фундаментальных принципах .

По мнению Ха, для прогресса ИИ необходим баланс: большие модели должны уметь работать на маленьких чипах с низким энергопотреблением .

📉 «Узкие места» как катализатор абстрактного мышления 5:15

Гость утверждает, что человеческое сознание и язык возникли как результат физиологических и когнитивных ограничений (bottlenecks). Мы передаем сложные концепции через узкий канал связи — слова, жесты или рисунки, что заставляет мозг формировать абстрактные представления .

В своих ранних работах Дэвид Ха применял принцип ограничений к генеративным моделям:

CPPN (Compositional Pattern-Producing Networks): вместо прямой генерации пикселей в 2016 году Ха использовал абстрактные правила параметризации. Это позволило создавать изображения цифр MNIST в разрешении 1000x1000 еще до того, как аппаратное обеспечение позволило делать это напрямую через GAN .
Sketch-RNN: модель для генерации дудлов (набросков), обученная на данных игры Quick Draw. Вместо работы с сеткой пикселей, модель оперирует векторными штрихами, имитируя то, как человек изображает объекты (например, свинью) с минимальным количеством деталей .

Дэвид полагает, что изучение того, как люди создают минималистичные репрезентации (из-за ограничений в виде рук, палок и поверхности пещер), помогает понять наши собственные индуктивные смещения (inductive biases) и перенести их в ИИ .

🎮 World Models: обучение внутри нейронного симулятора 12:07

Одним из самых известных проектов Дэвида Ха стала работа «World Models» (Модели мира), созданная совместно с Юргеном Шмидтхубером .

Ключевые механизмы World Models:

Вариационный автокодировщик (VAE): сжимает визуальный поток игры в низкоразмерное латентное пространство (информационное «узкое место») .
Рекуррентная нейросеть (RNN): предсказывает будущее состояние этого латентного пространства на основе текущих действий .
Контроллер: очень простая модель, которая принимает решения, имея на входе всего около 200 чисел (скрытое состояние RNN и вектор VAE), вместо миллионов пикселей .

Результатом этого подхода стала первая нейросеть, успешно прошедшая задание Car Racing в OpenAI Gym . По словам Ха, оптимизировать политику агента гораздо проще, когда данные уже очищены от шума и представлены в виде компактной абстракции. Этот метод лег в основу более поздних эффективных алгоритмов, таких как SimPLe (2019 год) и Dreamer .

👀 Жесткое внимание и «интенциональная слепота» 23:13

В проекте «Neuroevolution of Self-Interpretable Agents», выполненном под руководством Юджина Танга, команда Ха заменила латентное сжатие механизмом «жесткого внимания» (Hard Attention) .

Основные особенности метода:

Агенту разрешено видеть только 10 небольших патчей (фрагментов) экрана за раз .
Агент должен сам научиться решать, на какие точки «посмотреть», имитируя работу центральной ямки (fovea) человеческого глаза .
Эксперимент вдохновлен феноменом «интенциональной слепоты» (эксперимент с гориллой на баскетбольной площадке), когда сфокусированное внимание заставляет мозг игнорировать нерелевантные детали .

Преимущество такого ограничения — экстраординарная устойчивость. Если в игре Doom или Car Racing изменить цвет фона или добавить случайные объекты, агент с Hard Attention продолжает работать (zero-shot transfer), так как он просто не «смотрит» на неважные изменения . Обычные модели в таких условиях часто выходят из строя.

🧬 Нейроэволюция и архитектурный поиск 31:23

Дэвид Ха активно использует эволюционные алгоритмы (эволюционные стратегии, генетические алгоритмы) вместо градиентного спуска в задачах, где функции не дифференцируемы .

Проект Weight Agnostic Neural Networks (WANN):

Цель: найти архитектуры нейросетей, которые способны выполнять задачи (например, ходьба двуногого робота) даже со случайными весами, которые не менялись в процессе обучения .
Исследование показало, что сама структура сети может нести в себе «врожденные знания» или сильное индуктивное смещение, подобно тому как животные умеют ходить или избегать хищников сразу после рождения .
Хотя точность WANN на MNIST составила всего около 92%, работа вызвала большой интерес в сообществе нейробиологов .

В робототехнике, по словам гостя, эволюционные алгоритмы (такие как CMA-ES или Augmented Random Search) популярны из-за их объяснимости и эффективности для небольших контроллеров объемом в 1000–10000 параметров .

👅 Сенсорная замена и перемешивание входов 41:43

Последние исследования гостя посвящены способности агентов адаптироваться к изменению сенсоров. Ха приводит в пример опыты Пола Бах-и-Риты :

Слепые люди учились «видеть» через тактильные сигналы от камеры, подаваемые на решетку электродов на спине или языке .
Через несколько недель мозг начинал интерпретировать покалывания как визуальные образы .

Команда Ха создала агент «Sensory Neuron as a Transformer». Они скармливали нейросети данные, порядок которых постоянно перемешивался (shuffled observations) . Благодаря использованию механизмов, схожих с Set Transformer, агент стал инвариантным к порядку входных данных .

Удивительным открытием стало то, что такой агент может работать, даже если данные перемешиваются прямо во время игрового эпизода каждые 100 шагов . Кроме того, модель научилась игнорировать лишний шум: если ей дать 5 нужных сигналов и 15 шумовых в случайном порядке, она сама находит важные связи .

🐜 Будущее: коллективный интеллект и самоорганизация 1:00:10

Дэвид Ха выразил восхищение работами своего коллеги Александра Мордвинцева над нейронными клеточными автоматами . В будущем Ха планирует отойти от монолитных нейросетей в сторону коллективного интеллекта.

Его видение включает:

Системы из сотен тысяч уникальных агентов с локальными правилами обработки .
Возникновение глобальных свойств (emergent properties) из взаимодействия простых юнитов .
Объединение машинного обучения с компьютерным моделированием сложных систем и роевого интеллекта (swarm intelligence) .

По мнению гостя, такой подход может решить хронические проблемы обучения с подкреплением — хрупкость алгоритмов и их плохую способность к обобщению .