# Почему искусственные нейросети пугающе похожи на мозг

Источник: https://www.youtube.com/watch?v=3t06ajvBtl0
Канал: Lex Fridman
Опубликовано: 03.07.2020

---

«Паттерны активности в искусственных моделях выглядят пугающе похожими на то, что мы видим в мозге». Известный исследователь Мэтт Ботвиник убежден, что разделение нейробиологии и искусственного интеллекта абсолютно искусственно, а префронтальная кора человека способна реализовывать быстрые алгоритмы адаптации подобно рекуррентным сетям. Синергия этих дисциплин на примере дистрибутивного обучения и природы дофамина не просто приближает нас к разгадке мышления, но и ставит перед инженерами задачу научить будущие машины искренней социальной теплоте.

## 🧠 Архитектура разума: от биологии к вычислениям

[[JUMP:03:30]]

Мы живем в странный момент истории нейронауки. С одной стороны, мы достигли впечатляющих успехов в понимании того, как мозг функционирует на макроуровне — мы можем описать, какие задачи он решает и как именно поведение вытекает из перцептивных входных данных. С другой стороны, остается «зияющая пропасть» между этим высокоуровневым пониманием функций мозга и знанием конкретных нейронных механизмов.

Хотя современные технологии позволяют нам «видеть» активность на уровне отдельных нейронов или даже дендритов, мы пока не можем до конца связать эти микроскопические процессы с тем, как именно возникают высокоуровневые когнитивные операции. Это создает ситуацию, напоминающую наблюдение за миром сквозь туман: мы видим очертания функций, но детали механизмов скрыты.

### Единство психологии и нейронауки

[[JUMP:05:20]]

Мэтт Ботвиник подчеркивает, что с годами он стал всё более скептически относиться к искусственному разделению психологии и нейронауки. Для него нейронаука — это прежде всего дисциплина, изучающая то, для чего предназначен мозг. 

Ботвиник проводит аналогию с изучением почек: никто не пытается понять работу почки, не определив заранее её биологическую цель — фильтрацию крови и выведение продуктов метаболизма. Мозг же, по его мнению, предназначен для генерации адаптивного поведения: преобразования перцептивных сигналов в полезные двигательные ответы. Таким образом:

*   **Психология** занимается изучением структуры этой функции — как именно мы строим поведение.
*   **Нейронаука** занимается поиском того, как эти когнитивные операции реализуются на физическом, механистическом уровне.

Разделение этих наук кажется ему продуктивным только в краткосрочной перспективе, но в идеале они должны слиться в единую дисциплину, объясняющую, как ментальная активность рождается из электрической активности нейронов.

### Метафоры как инструменты познания

[[JUMP:10:20]]

Долгое время в когнитивной психологии существовала своего рода «неуверенность» из-за использования абстрактных понятий — таких как «внимание» или «извлечение из памяти». Ботвиник сравнивает это с историей генетики: до открытия структуры ДНК ученые продуктивно работали с метафорой «гена», приписывая ему причинно-следственные свойства, не зная физического носителя.

Этот метод оказался оправданным:

*   Метафоры позволяют описывать «виртуальные механизмы», которые мы еще не можем свести к нейронным взаимодействиям.
*   Использование таких моделей дает ученым направление поиска, подсказывая, какие именно физические структуры стоит исследовать.
*   Хотя сами по себе психологические концепции не являются физическими механизмами, они служат каркасом для будущего понимания.

Для Ботвиника взаимодействие нейронов — это уже не метафора, а физический факт, место, где происходят причинно-следственные процессы. Однако без психологической рамки, описывающей, что именно мы пытаемся объяснить, нейробиологическое исследование рискует превратиться в случайное блуждание в темноте.

### От хирургии к нейросетям

[[JUMP:20:40]]

Путь Ботвиника в науку был извилистым. Во время обучения в медицинской школе он разрывался между психиатрией и хирургией. Его наставник, известный психоаналитик, заметил, что обе эти области роднит стремление «заглянуть под поверхность» и обнаружить скрытые механизмы внутри человека. 

Поворотным моментом стала его работа в психиатрическом отделении. Когда он выразил разочарование тем, что никто не изучает когнитивные процессы на уровне математических моделей, его коллега вручил ему книги по «параллельной распределенной обработке» (PDP) — одному из ранних названий того, что сегодня мы знаем как глубокое обучение (deep learning). 

Эти книги, посвященные нейронным сетям как способу моделирования человеческого разума, произвели на него неизгладимое впечатление и определили вектор всей его дальнейшей карьеры. Он вспоминает этот опыт как момент интеллектуального озарения: возможность связать абстрактные психологические концепции с конкретной вычислительной архитектурой.

## 🧠 Гибкость разума: от магии языка до механики префронтальной коры
[[JUMP:25:08]]

Разговор Лекса Фридмана с Мэттом Ботвиником переходит от общих философских вопросов к конкретным механизмам, которые делают человеческий интеллект уникальным. Одной из центральных тем становится осознание того, что современный искусственный интеллект, несмотря на свои успехи, всё ещё не улавливает «магию», присущую человеческому опыту и общению. Ранее в разговоре они касались разрыва между когнитивным и нейронным уровнями, и теперь это противоречие проявляется в обсуждении того, как мы измеряем прогресс ИИ.

### Ограниченность ИИ-бенчмарков и «магия» языка
[[JUMP:25:35]]

Мэтт Ботвиник признаётся, что дискуссии об ИИ часто кажутся ему разочаровывающе узкими. Как человек, всегда интересовавшийся искусством, он видит в человеческом опыте множество слоёв, которые невозможно свести к простому добавлению «эмоций» к «когнитивным функциям». Эта многогранность особенно ярко проявляется в языке.

В сообществе разработчиков ИИ принято использовать бенчмарки — стандартизированные тесты для оценки моделей. Однако Лекс и Мэтт отмечают, что в погоне за строгой научной метрикой теряется нечто фундаментальное:

* **Музыкальность и остроумие:** Язык — это не просто передача информации, это ритм, контекст и юмор.
* **Дух теста Тьюринга:** Настоящее прохождение теста требует не просто правильных ответов, а передачи того самого «субъективного богатства», которое бенчмарки игнорируют.
* **Научный редукционизм:** Попытка изучать когнитивные способности строго механистически часто приводит к потере «магии» человеческого общения.

### Спор о правилах и «квази-регулярности»
[[JUMP:28:30]]

Обсуждение богатства языка плавно перетекает в исторический спор когнитивистики, свидетелем которого Ботвиник был ещё в студенческие годы. Речь идёт о формировании прошедшего времени в английском языке — на первый взгляд сухой теме, которая на деле является полем битвы двух фундаментальных подходов к пониманию разума.

С одной стороны выступали сторонники «правил», утверждавшие, что мозг кодирует чёткие алгоритмы (например, добавление окончания *-ed*) и хранит отдельный список исключений. С другой стороны были коннекционисты — предшественники современных адептов глубокого обучения. Они утверждали, что мозг обучается на статистической плотности данных.

> «Если внимательно посмотреть на языковые корпуса, становится ясно: исключения не случайны. В них есть своя структура, свои подсказки», — поясняет Ботвиник.

Для описания этого явления был введён термин **«квази-регулярность»**. Это состояние, когда правила существуют, но они «грязные», переплетены с исключениями, которые сами по себе имеют логику. Ботвиник убеждён, что именно глубокие нейронные сети — лучший инструмент для моделирования этой сложности, так как они способны представлять всё богатство данных без упрощения до жестких формул.

### Коллективный интеллект и влияние среды
[[JUMP:34:10]]

Ещё один важный аспект интеллекта — его социальная природа. Хотя Ботвиник «упрямо» считает интеллект характеристикой отдельного индивида, он признаёт, что человеческое поведение немыслимо вне сообщества. Лекс Фридман приводит в пример идеи Юваля Харари о способности больших групп людей сходиться вокруг единой идеи, создавая некий распределённый разум.

Однако Мэтт акцентирует внимание на другом: структура нашего интеллекта определяется не только внутренними алгоритмами, но и **структурой внешнего мира**.

* **Взаимодействие со средой:** Когнитивная архитектура — это лишь часть уравнения; вторая часть — мир, в который она погружена.
* **Уроки Reinforcement Learning (RL):** В обучении с подкреплением агент учится ровно столько, сколько позволяет симуляция. В DeepMind это стало очевидным через механизмы «самовоспроизведения» (self-play), где другие агенты становятся частью среды, заставляя интеллект эволюционировать через конкуренцию.

### Префронтальная кора: механизм гибкости
[[JUMP:40:10]]

Когда речь заходит о биологической реализации этих способностей, Ботвиник обращается к своей основной специализации — префронтальной коре (ПФК). Анатомически это «передняя часть» коры головного мозга, расположенная перед моторными зонами.

История изучения ПФК полна трагизма: ключевые данные были получены после Первой мировой войны при наблюдении за ветеранами с повреждениями мозга. Великий российский нейропсихолог **Александр Лурия** был одним из первых, кто описал «фронтальный синдром». Он заметил, что повреждение этой зоны лишает человека когнитивной гибкости.



[Image of prefrontal cortex brain region]


Главная функция префронтальной коры — это управление поведением в противовес привычкам:

1.  **Автоматическое поведение:** Пути мозга, отвечающие за привычки, позволяют нам вести машину, не задумываясь.
2.  **Целенаправленное поведение:** ПФК позволяет подавлять автоматизмы.
3.  **Пример с «локтевым приветствием»:** В условиях пандемии привычное рукопожатие стало неуместным. Именно ПФК позволяет нам вовремя вспомнить контекст и заменить привычный жест ударом локтя. Пациенты Лурии с повреждением фронтальной коры не смогли бы этого сделать — рука сама потянулась бы для привычного пожатия.

### Интеллект животных: от мух до мышей
[[JUMP:46:15]]

В современной науке ведутся жаркие споры о том, можно ли изучать человеческую гибкость на простых организмах. Благодаря новым технологиям учёные могут детально отслеживать активность нейронов у мышей и плодовых мушек. 

Мэтт отмечает две позиции:

* **Скептицизм:** Мыши часто тратят огромное количество времени на обучение задачам, которые для человека тривиальны, что ставит под вопрос наличие у них истинной когнитивной гибкости.
* **Защита «природного разума»:** Исследователи животных возражают, что в естественной среде мыши демонстрируют поразительную сообразительность при решении физических задач (например, как протащить еду в нору через препятствие). 

Даже плодовые мушки способны к абстракциям и обобщению стимулов, что заставляет учёных пересматривать границы того, что мы называем «сложным интеллектом». Несмотря на различия, Ботвиник подчеркивает, что в мозге существует явная функциональная дифференциация — разные части делают разные вещи, и это подтверждается как случаями травм, так и прямыми измерениями активности нейронов.

## 🧠 Архитектура обучения: от нейронных кодов к мета-алгоритмам

[[JUMP:50:25]]

### Модульность мозга против «диффузного хаоса»

В современной нейронауке не утихает спор о том, насколько жестко разделены функции в человеческом мозгу. Мэтт Ботвиник отмечает, что, хотя наше когнитивное восприятие тяготеет к четким схемам, реальность оказывается гораздо сложнее. Исторически наука колебалась между двумя крайностями: представлением о мозге как о наборе изолированных модулей и теорией «диффузного хаоса» (undifferentiated mush), где всё связано со всем [52:52].

Современные данные указывают на то, что истина лежит посередине. Дифференциация зон мозга носит скорее градуальный (градиентный), чем дискретный характер [50:39]. Границы между регионами, даже в такой сложной структуре, как префронтальная кора, остаются размытыми и плохо поддаются четкому определению [51:20]. 

Ярким примером этой «размытости» является первичная зрительная кора (V1). Традиционно считалось, что её единственная задача — обработка базовых визуальных признаков, таких как края объектов. Однако исследования показывают, что при наличии достаточного объема данных в активности нейронов V1 можно обнаружить информацию о текущем поведении животного и даже об ожидаемой награде [52:12]. Это означает, что даже специализированные сенсорные зоны несут в себе глобальные сигналы, относящиеся к совершенно иным когнитивным доменам [52:39].

### Механизмы передачи информации в мозге

[[JUMP:53:35]]

Обсуждая физическую природу сигналов, Мэтт Ботвиник признает себя приверженцем «старой школы», считая концепцию частотного кодирования (rate coding) вполне адекватной абстракцией для понимания мозга [53:48]. Согласно этому подходу, ключевое значение имеет не точное время каждого отдельного импульса, а частота (интенсивность) спайков нейрона. Именно эта модель легла в основу современных нейросетей, где «активация» юнита соответствует частоте разрядов биологического нейрона [57:23].

Несмотря на существование альтернативных теорий — от важности точного тайминга спайков до экзотических идей о механических вибрациях нейронов как основе сигнала [55:20] — Ботвиник подчеркивает эффективность текущей парадигмы. 

*   Классический путь: нейромедиаторы изменяют напряжение на мембране, и при достижении порога происходит дискретный «выстрел» — спайк [56:41].
*   Искусственные сети игнорируют детали этих событий, фокусируясь на среднем значении активности.

Мэтт отмечает поразительный факт: когда исследователи тренируют глубокие нейросети на задачах, которые ранее выполняли приматы или люди, паттерны активности внутри этих систем становятся «пугающе похожими» на те, что наблюдаются в живом мозге [59:32]. Это косвенное, но убедительное доказательство того, что выбранный уровень абстракции (rate coding и обратное распространение ошибки) отражает некие фундаментальные принципы биологических вычислений [59:58].

### Meta-learning: обучение умению учиться

[[JUMP:1:00:50]]

Одной из самых захватывающих тем беседы становится мета-обучение (meta-learning). В психологии это известно как «обучение обучению» — феномен, когда опыт решения одних задач радикально ускоряет освоение новых [1:01:46]. Классический пример: изучение третьего иностранного языка дается гораздо легче первого, так как мозг уже «понял», как структурировать процесс [1:02:11].

В контексте ИИ мета-обучение возникает, когда один алгоритм в процессе работы порождает внутри себя другой, более быстрый алгоритм обучения [1:01:33]. Лекс Фридман и Мэтт Ботвиник обсуждают, как это реализуется в рекуррентных нейронных сетях (RNN). В таких сетях существует два уровня динамики:

1.  **Медленный уровень:** постепенное изменение весов синаптических связей под воздействием алгоритма обучения с подкреплением.
2.  **Быстрый уровень:** динамика паттернов активации, которая позволяет «удерживать» информацию в рабочей памяти [1:03:59].

Эксперименты DeepMind показали, что если тренировать RNN на последовательности взаимосвязанных задач (например, поиск работающей кнопки в разных коробках), сеть «магическим образом» вырабатывает стратегию быстрого освоения [1:05:31]. Если заморозить веса (прекратить обучение на медленном уровне), сеть всё равно продолжит эффективно адаптироваться к новым условиям [1:05:57]. Это происходит потому, что медленный процесс настройки связей «запрограммировал» в активациях сети полноценный алгоритм обучения.

### Префронтальная кора как мета-RL система

[[JUMP:1:07:45]]

В статье 2018 года Ботвиник и его коллеги выдвинули гипотезу, что префронтальная кора (ПФК) человека работает именно как система мета-обучения с подкреплением (Meta-RL). ПФК обладает высокой степенью рекуррентности, что делает её идеальной средой для поддержания активной памяти [1:08:02].

Согласно этой модели:

*   ПФК реализует алгоритм обучения прямо в своих паттернах нейронной активации, что позволяет нам мгновенно менять стратегию поведения [1:08:28].
*   Биологический механизм, настраивающий эти паттерны (аналог «медленного» обучения весов в ИИ), вероятно, управляется дофамином [1:09:09].

Мэтт подчеркивает «эмерджентную красоту» этого процесса: мета-обучение не нужно проектировать специально. Оно неизбежно возникает само собой, если система обладает памятью и обучается в среде, насыщенной повторяющимися структурами и закономерностями [1:12:33]. Наш мир полон такой «избыточности»: события каждого нового дня уникальны, но обладают глубоким «семейным сходством» с прошлым опытом [1:14:31]. Именно эта избыточность среды позволяет биологическому и искусственному интеллекту выходить на уровень абстракций и аналогий.

## 🧠 На стыке двух миров: дофамин, междисциплинарный барьер и будущее человеко-машинного взаимодействия
[[JUMP:1:15:10]]

### Дофаминовый мост: алгоритмы ИИ подтверждают законы нейробиологии
[[JUMP:1:15:10]]
Обсуждая последние прорывы, Лекс Фридман поднимает тему недавней резонансной научной публикации, посвященной связи дофамина и обучения с временными различиями (Temporal Difference, или TD-learning). Мэтт Ботвиник сразу же подчеркивает, что эта работа — результат масштабного командного труда, и отдельно отмечает ключевой вклад профессора Нао Утиды (Nao Uchida) из Гарварда. По словам ученого, долгое время перенос идей был односторонним: исследователи брали успешные алгоритмы из сферы искусственного интеллекта и проверяли, не реализует ли биологический мозг похожие механизмы. Однако ценность таких изысканий выходит далеко за рамки чистой нейробиологии. Биологическая верификация алгоритмов ИИ дает инженерам уверенность в том, что выбранные математические методы жизнеспособны, способны эффективно масштабироваться для решения комплексных задач и гармонично сочетаться с другими когнитивными механизмами.

Мэтт Ботвиник описывает эти взаимоотношения как «добродетельный круг» (virtuous circle) между ИИ и наукой о мозге, который существовал с момента зарождения обеих дисциплин. Исторически лидерство постоянно переходило от одной стороны к другой. На текущем этапе, благодаря взрывному росту технологий машинного обучения, ИИ временно вырвался вперед. Тем не менее, этот круг неизбежно продолжит вращаться: Мэтт Ботвиник убежден, что в недалеком будущем именно нейробиология завалит ИИ-разработчиков фундаментальными инсайтами, которые изменят вектор развития технологий.

### Проклятие двух инженерий: каково быть экспертом на стыке наук
[[JUMP:1:19:10]]
Лекс Фридман задает мета-вопрос о когнитивной пластичности: способен ли один человек сегодня одинаково глубоко владеть как инженерией искусственного интеллекта, так и современной нейробиологией? Подобное совмещение профессий Лекс в шутку сравнивает с одновременным освоением хирургии и истории искусств, что со стороны может казаться дилетантством. Мэтт Ботвиник соглашается, что для достижения мирового уровня в обеих областях требуется исключительный склад ума, скромно исключая себя из этого списка. Свой собственный путь в DeepMind он объясняет тем, что на стыке психологии и нейронаук всегда занимался компьютерным моделированием — именно эти методы сегодня легли в основу ИИ, обеспечив ему «входной билет» в индустрию.

Главным барьером для междисциплинарных исследователей Мэтт Ботвиник называет запредельную сложность технологического стека в каждой из наук. Современный фронт работ в ИИ требует колоссальной инженерной экспертизы: от написания кода до управления распределенными вычислениями и обработки гигантских массивов данных. Параллельно с этим в нейробиологии происходит собственный взрыв экспериментальных методов и инструментария, освоение которых требует не меньших усилий. В этих условиях идеальным решением для DeepMind становится формирование распределенного сообщества. Сам Мэтт Ботвиник иронично оценивает свою роль как человека, находящегося ровно посередине: не обладая абсолютной технической экспертизой в каждой детали из-за ограничений человеческого мозга, он способен видеть неочевидные связи. Именно такое интеллектуальное разнообразие позволяет команде формировать мощный «эмерджентный интеллект сообщества». Привлечение специалистов с бэкграундом в психологии помогает DeepMind избавляться от академических слепых пятен, догматичных метафор и зацикленности на узких темах, помогая ученым эффективно выводить друг друга из тупиков.

### За пределами безопасности: позитивная повестка человеко-машинного взаимодействия
[[JUMP:1:24:00]]
Когда Лекс Фридман замечает, что взаимодействие человека и агента (Human-Agent Interaction, HAI) долгое время оставалось слепым пятном для робототехники и ИИ, Мэтт Ботвиник признается, что его группа в DeepMind сейчас максимально сфокусирована именно на этой теме. Фундаментальный вопрос «Для чего мы создаем ИИ?» неизбежно приводит к ответу: чтобы сделать жизнь людей лучше. Однако на практике эта декларация оказывается ужасающе сложной, ведь современные ИИ-системы непрерывно учатся на собственном опыте, а не просто работают по жестким алгоритмам. Это порождает стандартные вопросы ИИ-безопасности, но команда Мэтта ищет позитивную формулировку: что конкретно означает «сделать жизнь лучше» в контексте обучающихся систем? Ученым пришлось признать, что необходимо детально изучать реальную психологию людей, их истинные мотивы и те противоречия, которые возникают, когда разные сообщества хотят противоположных вещей.

Чтобы приносить пользу цивилизации, обучающаяся система должна сама стать частью человеческого мира и взаимодействовать с ним напрямую. В процессе таких экспериментов задачи ИИ неизбежно выходят за рамки чистой инженерии. Ботвиник приводит метафору: если робот научится исполнять сонаты Бетховена с выразительностью, превосходящей любого человека, захотим ли мы вообще слушать такую музыку и ходить на его концерты? Это сфера предпочтений, культуры и философии. Ситуация драматически усложняется, когда один ИИ-агент должен одновременно удовлетворить противоречивые запросы нескольких людей — здесь инженерия ИИ вплотную смыкается с экономикой, политикой и теорией общественного выбора.

Мэтт Ботвиник предлагает отказаться от исключительно антиутопического нарратива о «роботах-повелителях». Существует альтернативный сценарий: накопление знаний ИИ-системами может вести их по пути мудрости, просветления и искренней благожелательности к человечеству. Лекс Фридман поддерживает эту мысль, критикуя классическую информатику за её зацикленность на анализе «худшего случая» (worst-case analysis) из-за первобытного страха перед хищниками. Вместо этого Лекс предлагает активно конструировать позитивные траектории человеческого прогресса рука об руку с ИИ.

Серьезный вызов носит и демократический характер: технологии создаются узкой группой инженеров, а применять их предстоит невероятно разнообразному человечеству. Именно поэтому команда Мэтта сейчас активно изучает труды по политологии и экономике, пытаясь перевести абстрактные философские дилеммы на язык эмпирических исследований в рамках обучения с подкреплением. Главная тонкость здесь психологическая: люди хотят, чтобы им помогали, но не желают, чтобы машины делали за них абсолютно всё. В противном случае человечество рискует оказаться в антиутопии по сценарию мультфильма «Валли» (Wall-E), где тотальная автоматизация лишила людей радости личных достижений.

## 🤖 Распределённое обучение и социальный портрет ИИ
[[JUMP:1:40:10]]

### Дистрибутивное обучение с подкреплением
[[JUMP:1:40:10]]

В последние годы в DeepMind и ряде других лабораторий произошёл важный сдвиг в понимании архитектур обучения с подкреплением (RL). В традиционном RL центральным элементом является сигнал ценности — представление того, насколько хорошо идут дела в данный момент. Обычно этот сигнал выражается одним числом, представляющим собой ожидаемую совокупную будущую награду [1:40:52].

Мэтт Ботвиник иллюстрирует это на примере игрока в казино:

*   В классической модели игрок оценивает ситуацию как средневзвешенное значение всех возможных исходов. Если вероятность выиграть 100 долларов равна 50%, а проиграть 100 долларов — тоже 50%, система сведёт это к ожидаемому значению «ноль» [1:41:19].
*   В новом подходе, получившем название «дистрибутивное RL», система моделирует полное распределение вероятностей. Она буквально «знает», что существует вероятность крупного выигрыша и вероятность болезненного проигрыша, не схлопывая их в одну среднюю цифру [1:41:32].

Эмпирические данные показали, что такое распределённое представление значительно ускоряет обучение и позволяет ИИ вырабатывать более эффективные стратегии [1:41:45]. Интуиция здесь заключается в том, что дистрибутивное обучение заставляет систему формировать более богатые внутренние репрезентации. В обычном RL две ситуации с одинаковым средним ожидаемым вознаграждением будут «сплющиваться» в одну точку [1:43:02]. Однако в реальности они могут иметь совершенно разные профили рисков. Сохранение этих различий в памяти позволяет системе быть более гибкой, когда она сталкивается с новыми задачами, где нюансы распределения становятся критически важными [1:43:28].

### Оптимистичные и пессимистичные нейроны
[[JUMP:1:43:50]]

Перенос идей из области ИИ в нейробиологию привёл к фундаментальному открытию в понимании работы мозга. Ранее в разговоре Мэтт Ботвиник упоминал классическую роль дофамина как сигнала ошибки предсказания награды (Temporal Difference learning), который долгое время считался единым скалярным числом. Однако совместная работа DeepMind и исследователей из Гарварда, включая Наосигэ Утиду, показала, что мозг может использовать дистрибутивное кодирование [1:46:40].

Эксперименты продемонстрировали, что популяция дофаминовых нейронов неоднородна. Вместо того чтобы всем вместе передавать одну и ту же среднюю «ошибку», разные нейроны настроены на разные части распределения вознаграждения:

1.  **«Оптимистичные» нейроны:** они активируются сильнее при получении наград, которые выше среднего ожидания, и игнорируют мелкие неудачи [1:43:50].
2.  **«Пессимистичные» нейроны:** они более чувствительны к потенциальным потерям или вознаграждениям ниже ожидаемого уровня.

Этот ансамбль нейронов фактически кодирует всё распределение вероятностей целиком, точно так же, как это делают современные алгоритмы в DeepMind [1:47:07]. Мэтт Ботвиник отмечает, что это «красивый пример того, как ИИ раскрывает нечто новое в нейробиологии» [1:47:32]. Это открытие подтверждает гипотезу, что мозг не просто суммирует опыт, а хранит сложную статистическую картину мира, что позволяет организмам выживать в условиях неопределённости. В будущем это может привести к полному стиранию границ между психологией поведения и изучением нейронных механизмов [1:50:48].

### Теплота и компетентность: психологический портрет ИИ
[[JUMP:1:53:20]]

Отвечая на вопрос Лекса Фридмана о возможности создания систем ИИ, способных на глубокую эмоциональную связь и взаимную любовь, Мэтт Ботвиник обращается к социальной психологии. Он ссылается на исследования Сьюзен Фиске из Принстона, которая предложила двухмерную схему восприятия людьми друг друга [1:53:42].

Согласно этой модели, мы оцениваем окружающих по двум ключевым шкалам:

*   **Компетентность (Способность):** Насколько этот субъект способен эффективно действовать? [1:54:10]
*   **Теплота:** Каковы его намерения по отношению ко мне? Дружелюбен ли он, заботлив ли?

Сегодня исследования в области ИИ почти полностью сосредоточены на «компетентности». Мы создаём агентов, которые играют в го на сверхчеловеческом уровне или решают сложные математические задачи, но они остаются «холодными» [1:55:16]. Для полноценного принятия ИИ обществом необходимо развивать измерение «теплоты». Мэтт полагает, что это и есть «ультимативный тест Тьюринга»: сможем ли мы когда-нибудь сказать про ИИ-систему: «Этот парень — отличный малый, он по-настоящему заботится о нас» [1:56:08].

Ботвиник подчеркивает, что теплота — это не просто «милая мордашка» на экране робота, а сложный паттерн поведения, демонстрирующий искреннее сострадание и внимание [1:55:42]. Вряд ли такие качества можно «запрограммировать» вручную с помощью набора правил. Скорее всего, системы должны будут обучаться навыкам социального взаимодействия в процессе общения с людьми, подобно тому, как дети учатся проявлять заботу, видя её со стороны взрослых [1:57:15]. Создание ИИ, который будет взаимодействовать с нами в манере, приносящей человеку эмоциональное удовлетворение, — одна из самых захватывающих и важных задач будущего [1:57:39].