Пять шагов эволюции: как история биологического мозга объясняет будущее искусственного интеллекта

The Cognitive Revolution 13,8 тыс. 1 ч 58 мин 8 мин 07.02.2024
Главное

В новом выпуске подкаста The Cognitive Revolution ведущий Нейтан Лабенц обсуждает с Максом Беннеттом, сооснователем компании BlueCore и автором книги «Краткая история интеллекта», эволюционный путь биологического мозга. Собеседники подробно анализируют пять ключевых когнитивных прорывов, сформировавших человеческий разум за последние 600 миллионов лет, и сопоставляют их с развитием современных архитектур искусственного интеллекта. Этот детальный разбор проливает свет на фундаментальные различия между живыми организмами и кремниевыми моделями, определяя направления для будущих технологических открытий.

🧭 Прорыв 1: Руление и рождение системы вознаграждения 15:31

Около 600 миллионов лет назад Земля выглядела совершенно иначе: на суше полностью отсутствовала жизнь, планета из космоса не казалась зеленой, а океаны населяли преимущественно одноклеточные существа. В этот период начали зарождаться многоклеточные организмы, разделившись на три основные ветви: грибы, растения (напоминавшие современные морские водоросли) и животные. Ранние животные, сходные с современными стрекающими — морскими анемонами, медузами и коралловыми полипами, — не имели централизованного мозга. Их заменяла распределенная нервная сеть (nerve nets), реализующая независимые рефлексы на внешние раздражители. Они обладали радиальной симметрией и пассивно ждали, пока пища коснется их щупалец; у них полностью отсутствовало ассоциативное обучение.

Переход от децентрализованной сети к полноценному мозгу произошел примерно 550–600 миллионов лет назад с появлением крошечных червеобразных существ размером с рисовое зерно — билатерий, обладавших двусторонней симметрией. В качестве их современного биологического аналога ученые глубоко исследуют нематоду C. elegans, чей мозг содержит всего 302 нейрона. Главным эволюционным новшеством этого этапа стал алгоритм «руления» (steering), или таксиса (taxis navigation). Вместо пассивного ожидания червь научился активно преследовать пищу и избегать опасностей, ориентируясь по физическим градиентам концентрации химических веществ в жидкой среде.

Этот простейший алгоритм заложил три фундаментальных принципа интеллекта, которые Макс Беннетт описывает следующим образом:

По мнению Беннетта, аналогичный принцип используется в роботах-пылесосах Roomba с функцией Dirt Detect: обнаружив грязь, робот перестает двигаться хаотично и начинает вращаться на одном месте, максимизируя сбор мусора в замусоренной зоне. В мозге червя промежуточные интернейроны интегрируют сигналы от разных рецепторов и взаимно подавляют друг друга. Это позволяет совершить один конкретный выбор при конкурирующих факторах — например, стоит ли голодной нематоде преодолевать токсичный для нее медный барьер ради достижения источника пищи.

🧠 Прорыв 2: Подкрепление и алгоритмы обучения методом проб и ошибок 36:20

В Кембрийский период произошло масштабное расширение биоразнообразия, где доминировали крупные членистоногие хищники, превосходившие по размерам человека. Наши предки — первые позвоночные — были небольшими рыбоподобными существами в середине пищевой цепочки. Именно у них сформировался базовый шаблон мозга позвоночных, который на 70% совпадает с человеческим: он уже включал передний, средний и задний мозг, кору (паллиум), таламус и базальные ганглии.

Рыбы обрели способность учиться на собственных ошибках (trial-and-error learning) гораздо эффективнее червей. Беннетт напоминает об исторических корнях теории обучения, упоминая Эдварда Торндайка, который в начале XX века изучал поведение кошек и цыплят в «проблемных ящиках» (puzzle boxes). Торндайк сформулировал «закон эффекта», заметив, что животные не совершают мгновенных ментальных открытий (инсайтов) и не учатся через подражание. Они постепенно снижают время выхода из клетки за счет механического закрепления успешных случайных действий. Позже Б. Ф. Скиннер довел эту идею до абсолюта, утверждая, что вообще все обучение сводится к оперантному обучению, что, как отмечает гость, впоследствии оказалось неверным.

Долгое время в компьютерных науках не удавалось воспроизвести обучение методом проб и ошибок из-за проблемы «распределения временного кредита» (temporal credit assignment problem). Действия, ведущие к победе (например, в шахматах), часто совершаются в середине процесса, а не в самом конце. Попытка Марвина Минского создать в 1950-х годах систему SNARK на основе простого подкрепления последних шагов провалилась. Решение предложил Ричард Саттон, разработавший алгоритм обучения на основе временных различий (Temporal Difference, TD-learning). Согласно Саттону, сигнал подкрепления должен генерироваться не в момент получения итоговой награды, а при изменении ожидаемой будущей награды.

Исследования показывают, что базальные ганглии позвоночных работают по схожему принципу:

Параллельно в коре ранних позвоночных развилась способность к распознаванию сложных паттернов (некоторые рыбы могут визуально различать человеческие лица) и формированию 3D-карты пространства. Гомолог этой зоны коры у млекопитающих развился в гиппокамп, содержащий нейроны места (place cells), позволяющие рыбе возвращаться к кормушке независимо от точки старта.

🎬 Прорыв 3: Моделирование и появление неокортекса 1:06:14

Около 150 миллионов лет назад, в эпоху динозавров, наши предки были крошечными четырехдюймовыми млекопитающими, прятавшимися в норах и охотившимися только по ночам. В их мозге трехслойная кора древних позвоночных трансформировалась в сложнейшую шестислойную структуру — неокортекс. Если у людей повреждение зон неокортекса ведет к драматическим последствиям вроде слепоты или паралича, то у крыс удаление моторной коры не вызывает паралича — они по-прежнему могут выполнять старые движения, но теряют способность обучаться новым тонким навыкам.

Макс Беннетт выдвигает гипотезу, что неокортекс развился не ради улучшения распознавания объектов (с этим прекрасно справляются и рыбы), а ради переключения мозга в режим генерации — способности симулировать варианты будущего до совершения реального действия. В основе этого лежит концепция Германа Гельмгольца «восприятие как логический вывод» (perception as inference) и гипотеза байесовского мозга. Мозг постоянно строит априорную модель мира и сравнивает ее с сенсорным потоком.

Эксперименты Дэвида Реддиша доказали наличие этого механизма у млекопитающих:

Этот прорыв открыл возможность контрфактуального обучения (counterfactual learning) — способности оценивать альтернативные сценарии («что было бы, если бы я поступил иначе»). Обезьяны при игре в «камень-ножницы-бумага» после проигрыша камню против бумаги увеличивают вероятность выбора ножниц в следующем раунде, мысленно просчитав выигрышный вариант в своей голове.

Ведущий Нейтан Лабенц проводит параллель с современным ИИ, отмечая, что методы вроде Chain of Thought (цепочка рассуждений) или Tree of Thoughts в больших языковых моделях выглядят как попытка сымитировать этот процесс моделирования. Однако Беннетт указывает на фундаментальное отличие: ИИ страдает от катастрофического забывания (catastrophic forgetting) при непрерывном обновлении весов (continual learning). Мозг млекопитающего решает эту проблему за счет выброса нейромодуляторов исключительно в моменты сильного удивления (ошибки прогнозирования), блокируя случайную перезапись синапсов и отвергая информацию, которая не встраивается в жесткую внутреннюю модель мира.

👥 Прорыв 4: Ментализация и модель собственного «Я» 1:31:46

С развитием приматов сформировались три уникальные когнитивные способности, отсутствующие у других млекопитающих: модель психического (theory of mind), продвинутое имитационное обучение и предвосхищение будущих потребностей. В мозге приматов для этого развилась гранулярная префронтальная кора (granular prefrontal cortex). Этот отдел представляет собой иерархический слой «над» старым неокортексом: он получает информацию не от гиппокампа напрямую, а от других зон коры, фактически создавая «модель модели» или инструмент метакознания.

Для подтверждения наличия модели психического у животных Беннетт приводит ряд ярких исследований:

Гранулярная префронтальная кора позволяет приматам моделировать самих себя в будущих состояниях. Пациенты с повреждением этой зоны могут детально описать вымышленный мир будущего, но физически неспособны поместить себя внутрь воображаемого сценария. Способность прогнозировать будущие потребности подтверждается тестом, где саймири (беличьи обезьяны) отказывались от сиюминутного лакомства, зная, что оно вызовет сильную жажду, а воды не будет долгое время; крысы пройти этот тест не смогли. Беннетт делает вывод, что теория ума, эмпатия и обучение через понимание чужих намерений — это не разные функции, а три проявления одного алгоритма: симуляции собственной внутренней симуляции.

🤖 Будущее ИИ: Архитектура, коннектомика и этика цифрового разума 1:44:12

Пятый прорыв — человеческая речь — упоминается в контексте глобального финала эволюционной цепочки, однако беседа смещается к макроархитектуре будущих интеллектуальных систем. Макс Беннетт выражает сомнение в том, что полноценный искусственный интеллект общего уровня (AGI) будет представлять собой одну гигантскую масштабированную нейросеть. По его мнению, автономные роботы будущего станут макро-сборками из специализированных подсистем: сверточной сети для зрения, языковой модели, отдельной динамической модели мира и блока эпизодической памяти, взаимодействующих друг с другом наподобие отделов живого мозга.

Обсуждая попытки оцифровать мозг напрямую (например, проекты OpenWorm или полное картирование коннектома плодовой мушки дрозофилы), Беннетт предупреждает об ограниченности такого подхода. Знание карты синапсов (коннектома) не раскрывает логику вычислений:

В финале дискуссии собеседники поднимают глубокие вопросы этического статуса (moral patienthood) ИИ и животных. Беннетт предлагает разделять квалиа (субъективный опыт переживания боли, страха, удовольствия), генерируемый в неокортексе млекопитающих и птиц, и идентичность (осознание своего «Я»), развившуюся у приматов. По мнению гостя, моральный вес должен быть привязан именно к способности чувствовать страдание (квалиа), а не к эго-идентичности. С этой позиции, крыса обладает сопоставимым с человеком моральным статусом, так как способна испытывать подлинное страдание. Применяя этот материалистический подход к искусственному интеллекту, Беннетт констатирует, что человечество пока не имеет твердого философского фундамента, чтобы определить момент, когда кремниевый алгоритм начнет обладать субъективным опытом и потребует защиты своих прав.

💬 Цитаты

«Восприятие — это логический вывод: то, что мы видим, является нашей априорной попыткой предугадать истинное состояние мира.»

«Моральный вес должен быть привязан именно к способности чувствовать страдание, а не к эго-идентичности существа.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Неокортекс
Шестислойная кора головного мозга млекопитающих, отвечающая за высшие когнические функции и симуляцию будущего.
Базальные ганглии
Древняя структура мозга позвоночных, регулирующая выбор моторных программ на основе дофаминого подкрепления.
Обучение на основе временных различий (TD-learning)
Алгоритм обучения с подкреплением, использующий изменения в прогнозе будущей награды в качестве обучающего сигнала.
Модель психического (Theory of Mind)
Способность распознавать чужие ментальные состояния, мотивы, знания и намерения.
📊 Цифры
🗓 Хронология
  1. 600 млн лет назад Период существования древних многоклеточных организмов без мозга с радиальной нервной сетью.
  2. 550 млн лет назад Появление первых червеобразных билатерий с двусторонней симметрией и таксисной навигацией.
  3. 500 млн лет назад Кембрийский взрыв, появление первых позвоночных с базальными ганглиями и обучением методом проб и ошибок.
  4. 150 млн лет назад Развитие первых млекопитающих с шестислойным неокортексом и способностью к ментальному моделированию.
⚖️ Другая сторона
Искусственный интеллект Макс Беннетт The Cognitive Revolution базальные ганглии неокортекс теория ума