Пять шагов эволюции: как история биологического мозга объясняет будущее искусственного интеллекта

В новом выпуске подкаста The Cognitive Revolution ведущий Нейтан Лабенц обсуждает с Максом Беннеттом, сооснователем компании BlueCore и автором книги «Краткая история интеллекта», эволюционный путь биологического мозга. Собеседники подробно анализируют пять ключевых когнитивных прорывов, сформировавших человеческий разум за последние 600 миллионов лет, и сопоставляют их с развитием современных архитектур искусственного интеллекта. Этот детальный разбор проливает свет на фундаментальные различия между живыми организмами и кремниевыми моделями, определяя направления для будущих технологических открытий.

🧭 Прорыв 1: Руление и рождение системы вознаграждения 15:31

Около 600 миллионов лет назад Земля выглядела совершенно иначе: на суше полностью отсутствовала жизнь, планета из космоса не казалась зеленой, а океаны населяли преимущественно одноклеточные существа. В этот период начали зарождаться многоклеточные организмы, разделившись на три основные ветви: грибы, растения (напоминавшие современные морские водоросли) и животные. Ранние животные, сходные с современными стрекающими — морскими анемонами, медузами и коралловыми полипами, — не имели централизованного мозга. Их заменяла распределенная нервная сеть (nerve nets), реализующая независимые рефлексы на внешние раздражители. Они обладали радиальной симметрией и пассивно ждали, пока пища коснется их щупалец; у них полностью отсутствовало ассоциативное обучение.

Переход от децентрализованной сети к полноценному мозгу произошел примерно 550–600 миллионов лет назад с появлением крошечных червеобразных существ размером с рисовое зерно — билатерий, обладавших двусторонней симметрией. В качестве их современного биологического аналога ученые глубоко исследуют нематоду C. elegans, чей мозг содержит всего 302 нейрона. Главным эволюционным новшеством этого этапа стал алгоритм «руления» (steering), или таксиса (taxis navigation). Вместо пассивного ожидания червь научился активно преследовать пищу и избегать опасностей, ориентируясь по физическим градиентам концентрации химических веществ в жидкой среде.

Этот простейший алгоритм заложил три фундаментальных принципа интеллекта, которые Макс Беннетт описывает следующим образом:

Валентность (valence): Эволюционная классификация стимулов на «хорошие» и «плохие», что в сообществе ИИ называют понятием награды (reward). У нематод валентность жестко зашита генетически: сенсорные нейроны, улавливающие запах еды, напрямую соединены с интернейронами, запускающими моторную программу движения вперед.
Аффективные состояния (behavioral/affective states): Поведенческие режимы, которые длятся дольше самого стимула. Реальные запахи в воде распространяются хаотично из-за течений, поэтому нематоды используют дофаминовые нейроны, выходящие наружу тела. Стоит червю пересечь зону с молекулами пищи, дофамин заливает его мозг и активирует состояние «блужания» (dwelling) — локального целенаправленного поиска, продолжающегося даже после исчезновения запаха.
Дихотомия химических сигналов: Дофамин выступает как гормон поиска и преследования (exploitation/seeking), тогда как серотонин, выделяющийся при попадании пищи в глотку червя, запускает состояние покоя и насыщения.

По мнению Беннетта, аналогичный принцип используется в роботах-пылесосах Roomba с функцией Dirt Detect: обнаружив грязь, робот перестает двигаться хаотично и начинает вращаться на одном месте, максимизируя сбор мусора в замусоренной зоне. В мозге червя промежуточные интернейроны интегрируют сигналы от разных рецепторов и взаимно подавляют друг друга. Это позволяет совершить один конкретный выбор при конкурирующих факторах — например, стоит ли голодной нематоде преодолевать токсичный для нее медный барьер ради достижения источника пищи.

🧠 Прорыв 2: Подкрепление и алгоритмы обучения методом проб и ошибок 36:20

В Кембрийский период произошло масштабное расширение биоразнообразия, где доминировали крупные членистоногие хищники, превосходившие по размерам человека. Наши предки — первые позвоночные — были небольшими рыбоподобными существами в середине пищевой цепочки. Именно у них сформировался базовый шаблон мозга позвоночных, который на 70% совпадает с человеческим: он уже включал передний, средний и задний мозг, кору (паллиум), таламус и базальные ганглии.

Рыбы обрели способность учиться на собственных ошибках (trial-and-error learning) гораздо эффективнее червей. Беннетт напоминает об исторических корнях теории обучения, упоминая Эдварда Торндайка, который в начале XX века изучал поведение кошек и цыплят в «проблемных ящиках» (puzzle boxes). Торндайк сформулировал «закон эффекта», заметив, что животные не совершают мгновенных ментальных открытий (инсайтов) и не учатся через подражание. Они постепенно снижают время выхода из клетки за счет механического закрепления успешных случайных действий. Позже Б. Ф. Скиннер довел эту идею до абсолюта, утверждая, что вообще все обучение сводится к оперантному обучению, что, как отмечает гость, впоследствии оказалось неверным.

Долгое время в компьютерных науках не удавалось воспроизвести обучение методом проб и ошибок из-за проблемы «распределения временного кредита» (temporal credit assignment problem). Действия, ведущие к победе (например, в шахматах), часто совершаются в середине процесса, а не в самом конце. Попытка Марвина Минского создать в 1950-х годах систему SNARK на основе простого подкрепления последних шагов провалилась. Решение предложил Ричард Саттон, разработавший алгоритм обучения на основе временных различий (Temporal Difference, TD-learning). Согласно Саттону, сигнал подкрепления должен генерироваться не в момент получения итоговой награды, а при изменении ожидаемой будущей награды.

Исследования показывают, что базальные ганглии позвоночных работают по схожему принципу:

Эволюционная консервация: Базальные ганглии рыбы структурно и функционально практически идентичны человеческим.
Роль дофамина: Фазические вспышки дофамина у высших животных происходят не при выдаче лакомства, а в момент появления стимула (сигнала), предсказывающего эту награду. Если ожидания улучшаются, дофамин растет, подкрепляя синапсы; если ожидаемая награда не получена — уровень дофамина падает ниже базового.

Параллельно в коре ранних позвоночных развилась способность к распознаванию сложных паттернов (некоторые рыбы могут визуально различать человеческие лица) и формированию 3D-карты пространства. Гомолог этой зоны коры у млекопитающих развился в гиппокамп, содержащий нейроны места (place cells), позволяющие рыбе возвращаться к кормушке независимо от точки старта.

🎬 Прорыв 3: Моделирование и появление неокортекса 1:06:14

Около 150 миллионов лет назад, в эпоху динозавров, наши предки были крошечными четырехдюймовыми млекопитающими, прятавшимися в норах и охотившимися только по ночам. В их мозге трехслойная кора древних позвоночных трансформировалась в сложнейшую шестислойную структуру — неокортекс. Если у людей повреждение зон неокортекса ведет к драматическим последствиям вроде слепоты или паралича, то у крыс удаление моторной коры не вызывает паралича — они по-прежнему могут выполнять старые движения, но теряют способность обучаться новым тонким навыкам.

Макс Беннетт выдвигает гипотезу, что неокортекс развился не ради улучшения распознавания объектов (с этим прекрасно справляются и рыбы), а ради переключения мозга в режим генерации — способности симулировать варианты будущего до совершения реального действия. В основе этого лежит концепция Германа Гельмгольца «восприятие как логический вывод» (perception as inference) и гипотеза байесовского мозга. Мозг постоянно строит априорную модель мира и сравнивает ее с сенсорным потоком.

Эксперименты Дэвида Реддиша доказали наличие этого механизма у млекопитающих:

Ментальные развилки: В моменты выбора пути крыса останавливается и оглядывается, запуская викарный метод проб и ошибок.
Вспышки нейронов места: Записи активности гиппокампа показывают, что в моменты паузы нейроны места перестают кодировать текущую координату крысы и поочередно «проигрывают» траектории возможных путей вглубь лабиринта.

Этот прорыв открыл возможность контрфактуального обучения (counterfactual learning) — способности оценивать альтернативные сценарии («что было бы, если бы я поступил иначе»). Обезьяны при игре в «камень-ножницы-бумага» после проигрыша камню против бумаги увеличивают вероятность выбора ножниц в следующем раунде, мысленно просчитав выигрышный вариант в своей голове.

Ведущий Нейтан Лабенц проводит параллель с современным ИИ, отмечая, что методы вроде Chain of Thought (цепочка рассуждений) или Tree of Thoughts в больших языковых моделях выглядят как попытка сымитировать этот процесс моделирования. Однако Беннетт указывает на фундаментальное отличие: ИИ страдает от катастрофического забывания (catastrophic forgetting) при непрерывном обновлении весов (continual learning). Мозг млекопитающего решает эту проблему за счет выброса нейромодуляторов исключительно в моменты сильного удивления (ошибки прогнозирования), блокируя случайную перезапись синапсов и отвергая информацию, которая не встраивается в жесткую внутреннюю модель мира.

👥 Прорыв 4: Ментализация и модель собственного «Я» 1:31:46

С развитием приматов сформировались три уникальные когнитивные способности, отсутствующие у других млекопитающих: модель психического (theory of mind), продвинутое имитационное обучение и предвосхищение будущих потребностей. В мозге приматов для этого развилась гранулярная префронтальная кора (granular prefrontal cortex). Этот отдел представляет собой иерархический слой «над» старым неокортексом: он получает информацию не от гиппокампа напрямую, а от других зон коры, фактически создавая «модель модели» или инструмент метакознания.

Для подтверждения наличия модели психического у животных Беннетт приводит ряд ярких исследований:

Эксперимент с очками: Шимпанзе дают примерить двое очков (одни прозрачные, другие — непрозрачные). Затем они безошибочно просят еду у того экспериментатора, на котором надеты прозрачные очки, понимая, кто из людей способен их видеть.
Интенция против случайности: Если человек намеренно отмечает коробку с едой красным маркером, обезьяна выбирает ее. Если человек делает аналогичную отметку, случайно уронив маркер, примат игнорирует эту коробку, считывая внутреннее намерение человека.
Циклы обмана и контробмана: Исследователь Эмиль Мензел описал шимпанзе по имени Белль, которая знала, где спрятана еда. Когда доминантный и агрессивный самец по имени Рок стал отбирать у нее пищу, Белль начала умышленно уводить его в противоположную часть вольера, выжидала паузу и бежала к тайнику.

Гранулярная префронтальная кора позволяет приматам моделировать самих себя в будущих состояниях. Пациенты с повреждением этой зоны могут детально описать вымышленный мир будущего, но физически неспособны поместить себя внутрь воображаемого сценария. Способность прогнозировать будущие потребности подтверждается тестом, где саймири (беличьи обезьяны) отказывались от сиюминутного лакомства, зная, что оно вызовет сильную жажду, а воды не будет долгое время; крысы пройти этот тест не смогли. Беннетт делает вывод, что теория ума, эмпатия и обучение через понимание чужих намерений — это не разные функции, а три проявления одного алгоритма: симуляции собственной внутренней симуляции.

🤖 Будущее ИИ: Архитектура, коннектомика и этика цифрового разума 1:44:12

Пятый прорыв — человеческая речь — упоминается в контексте глобального финала эволюционной цепочки, однако беседа смещается к макроархитектуре будущих интеллектуальных систем. Макс Беннетт выражает сомнение в том, что полноценный искусственный интеллект общего уровня (AGI) будет представлять собой одну гигантскую масштабированную нейросеть. По его мнению, автономные роботы будущего станут макро-сборками из специализированных подсистем: сверточной сети для зрения, языковой модели, отдельной динамической модели мира и блока эпизодической памяти, взаимодействующих друг с другом наподобие отделов живого мозга.

Обсуждая попытки оцифровать мозг напрямую (например, проекты OpenWorm или полное картирование коннектома плодовой мушки дрозофилы), Беннетт предупреждает об ограниченности такого подхода. Знание карты синапсов (коннектома) не раскрывает логику вычислений:

У нейронов разные базовые частоты и режимы активации (фазический или тонический).
Синапсы имеют принципиально разные коэффициенты обучения в зависимости от геометрии дендритных шипиков.
Без понимания экспрессии рецепторов невозможно определить, является ли связь возбуждающей, тормозящей или нейромодулирующей.

В финале дискуссии собеседники поднимают глубокие вопросы этического статуса (moral patienthood) ИИ и животных. Беннетт предлагает разделять квалиа (субъективный опыт переживания боли, страха, удовольствия), генерируемый в неокортексе млекопитающих и птиц, и идентичность (осознание своего «Я»), развившуюся у приматов. По мнению гостя, моральный вес должен быть привязан именно к способности чувствовать страдание (квалиа), а не к эго-идентичности. С этой позиции, крыса обладает сопоставимым с человеком моральным статусом, так как способна испытывать подлинное страдание. Применяя этот материалистический подход к искусственному интеллекту, Беннетт констатирует, что человечество пока не имеет твердого философского фундамента, чтобы определить момент, когда кремниевый алгоритм начнет обладать субъективным опытом и потребует защиты своих прав.