Почему слепое копирование мозга не создаст сильный ИИ

Идеально точная симуляция миллиардов нейронов не приблизит нас к разгадке разума, подобно тому как слепое копирование взмахов птичьего крыла никогда бы не подняло в небо первый самолет. Биологический мозг не занимается грубым статистическим обсчетом данных — он постоянно проецирует внутренние ожидания, конструируя реальность через динамический инференс и контекст. Известный исследователь ИИ Дилип Джордж объясняет, почему современные языковые модели зашли в тупик без структурной модели мира и как принципы работы кортекса способны перевернуть индустрию технологий.

🧠 Путь к сильному ИИ: почему слепое копирование мозга обречено на провал 0:45

Функциональный подход к интеллекту: уроки эволюции 0:45

Создание искусственного интеллекта, способного сравняться с человеческим разумом, требует глубокого переосмысления синергии между инженерией и биологией. Исследователь Дилип Джордж (Dileep George), получивший известность как сооснователь амбициозных проектов Numenta (вместе с Джеффом Хокинсом и Донной Дубински) и Vicarious, на протяжении всей своей карьеры ищет способы спроектировать интеллект, архитектурно близкий к человеческому мозгу. Ведущий подкаста Лекс Фридман (Lex Fridman) подчеркивает, что современные научные знания о принципах работы человеческого мозга пока крайне скудны. Тем не менее, даже те крупицы информации, которыми мы располагаем, дают инженерам гораздо более ценные подсказки для построения мыслящих машин, чем любые абстрактные идеи из математики, физики или компьютерных наук, лежащие вне биологии.

Биологический мозг, по сути, выступает фундаментальным доказательством существования работающего интеллекта — неким «existence proof», который подтверждает выполнимость этой сложнейшей инженерной задачи. В то же время Дилип Джордж признает, что концепция «ИИ, вдохновленного мозгом» (brain-inspired AI), сегодня подвержена сильному хайпу и часто используется маркетологами ради красивого словца, подобно квантовым вычислениям. Однако за этим информационным шумом скрывается реальное содержание. Главный тезис эксперта заключается в том, что для создания подлинного искусственного интеллекта необходимо сначала понять базовые вычислительные принципы работы мозга на его функциональном уровне, а не пытаться бездумно скопировать его физическую, молекулярную структуру.

Крах избыточной детализации: критика проекта Blue Brain 4:59

Ярким примером ошибочного, по мнению Дилипа Джорджа, вектора развития науки является знаменитый проект Blue Brain, возглавляемый Генри Маркрамом. Стратегия этого проекта заключалась в попытке построить работающую модель мозга вообще без предварительного понимания его глобальных алгоритмов. Исследователи просто переносили колоссальные массивы данных, полученных в ходе разрозненных нейробиологических экспериментов, в гигантскую компьютерную симуляцию. Они рассчитывали, что если объединить вместе как можно больше нейронов и воспроизвести максимум биологических деталей, из этой массы спонтанно возникнет разумное поведение.

Дилип Джордж категорически критикует эту концепцию, указывая на ее фундаментальную инженерную уязвимость — невозможность отладки. Если столь переусложненная система начинает работать не так, как ожидалось, у разработчиков нет инструментов, чтобы локализовать ошибку. Без внятной теории о том, как именно должны взаимодействовать компоненты и какой вклад каждый из них вносит в общие вычисления, ученые обречены лишь бесконечно наращивать объемы симулируемых данных. В рамках Blue Brain предпринимались попытки симулировать мозг крысы, кошки и человека, благо структура неокортекса у млекопитающих весьма схожа. Однако единственным стабильным результатом, который выдают подобные слепые симуляции при корректировке внутренних параметров, оказываются обычные нейронные осцилляции (ритмические колебания).

При этом используемые математические модели отдельных клеток невероятно сложны и изощренны. Они базируются на классических уравнениях Ходжкина — Хаксли, описывающих распространение электрических сигналов по кабелю, учитывают активные дендриты, работу кальциевых каналов и различных рецепторов. Моделирование ведется на уровне реальных физических механизмов с привлечением теории электрических цепей и распространения сигналов. Но даже если модель единичного нейрона верна на 99%, это никак не объясняет принципы работы всей сети в целом.

Загадка микропроцессора и контуры истинного моделирования 9:38

Чтобы наглядно проиллюстрировать тупиковость слепого копирования материи, Дилип Джордж приводит точную инженерную аналогию. Ситуация с Blue Brain эквивалентна попытке построить современный микропроцессор, имея на руках лишь идеальную математическую модель одного-единственного транзистора. Если исследователь не понимает архитектуру процессора, но пытается соединить миллионы транзисторов вместе, опираясь лишь на смутные экспериментальные догадки и статистику связей, он никогда не получит работающий компьютер. Для успешного проектирования чипа инженеру жизненно необходимо сначала освоить булеву логику, понять принципы работы логических вентилей и общую системную архитектуру.

В продолжение этой мысли Лекс Фридман вспоминает известную в научных кругах статью под названием «Может ли нейробиолог понять микропроцессор?». В ходе этого эксперимента ученые применили весь арсенал современных нейробиологических методов к изучению обычного компьютерного чипа (как если бы они были инопланетянами) и пришли к неутешительному выводу: классические инструменты биологии не способны обнаружить в процессоре ни булеву логику, ни тактовую частоту, ни особенности архитектуры. Дилип Джордж отмечает, что методология этой статьи, возможно, избыточно пессимистична, ведь следуя ей, даже профессиональный электротехник не смог бы разобраться в процессоре. Нейробиологи все же находят множество ценных инсайтов, но эти крупицы знаний невозможно механически объединить в рамках одной симуляции — их необходимо кропотливо упаковывать в единый вычислительный и информационный фреймворк.

Прогнозировать точные сроки разгадки тайн человеческого разума невозможно. Дилип Джордж напоминает, что за три года до триумфального полета братьев Райт в 1903 году авторитетное издание New York Times опубликовало статью о том, что человечество не сможет полететь еще минимум сто лет. Более того, даже один из создателей самолета в моменты депрессии незадолго до успеха заявлял, что полет человека принципиально невероятелен. Очевидно, что истинный путь к пониманию мозга лежит через итеративное функциональное моделирование на стыке ИИ и биологии:

Анализ и систематизация инсайтов, полученных экспериментальными нейробиологами;
Интерпретация этих данных с точки зрения теории обработки информации и построение работающих ИИ-моделей, способных выполнять целостные задачи, а не просто имитировать отдельные феномены;
Заполнение инженерным путем тех «белых пятен» и элементов мозаики, на которые биология дает лишь туманные намеки;
Проверка созданных функциональных моделей в реальном мире и использование полученных результатов для планирования новых целенаправленных экспериментов в нейробиологии.

Современные масштабные проекты по сбору данных коннектомики и изучению кортикальных микросхем прекрасны сами по себе, но без построения сквозных вычислительных моделей они никогда не расскажут нам связную историю о том, как именно рождается интеллект. В самом конце этой части беседы Дилип Джордж и Лекс Фридман также кратко затронули структуру зрительной коры и роль обратных связей в ней, однако детальный разбор этого механизма авторы оставили для последующих этапов беседы.

👁️ Проекция ожиданий: как мозг учит машины видеть 25:20

Мозг как генератор галлюцинаций: роль обратных связей в зрении 25:20

Наше восприятие реальности устроено гораздо глубже и тоньше, чем обычная однонаправленная передача сигналов от сетчатки глаза к высшим отделам коры. Как объясняет эксперт по ИИ Дилип Джордж (Dileep George), зрительная кора человека не является просто прямой цепочкой обработки данных. Напротив, мы постоянно и активно проецируем собственные ожидания на окружающий мир. Тот финальный образ, который мы воспринимаем как объективную реальность, представляет собой комбинацию двух встречных потоков: внутренних предсказаний нашей модели мира и реальных сенсорных стимулов, поступающих от органов чувств.

Этот процесс можно уподобить непрерывному вычислению разницы между прогнозом и реальностью. Мозг пытается подобрать наилучшее объяснение для входящего стимула, опираясь на уже сформированную внутреннюю модель. Именно на стыке этих встречных потоков рождаются оптические иллюзии — ситуации, в которых внутренние ожидания системы вступают в конфликт с физическим сигналом и перевешивают его.

Дилип Джордж подчеркивает, что такой механизм обратных связей невероятно эффективен с вычислительной точки зрения. Вместо того чтобы каждую секунду обрабатывать колоссальные объемы избыточной информации, мозг использует внутреннюю модель для постоянной «галлюцинации» того, как должен выглядеть мир. Входящий поток сканируется преимущественно на предмет новизны или отклонений от прогноза. Этим объясняется, например, тот факт, что наша зрительная система эволюционно приспособлена мгновенно и безошибочно фиксировать любое движение: движущийся объект нарушает статичное предсказание модели, генерируя сигнал ошибки, требующий немедленного объяснения.

На вопрос ведущего Лекса Фридмана (Lex Fridman) о том, на каком уровне коры — низшем или высшем — происходят эти процессы, исследователь отвечает однозначно: петли обратной связи доминируют абсолютно везде. Процесс инференса, или вывода данных, в мозге носит глубоко итеративный характер. Модель проецируется на свидетельства, а свидетельства затем возвращаются в модель, корректируя её в рамках непрерывного цикла «вперед-назад». В ходе этой итерации внутри системы могут возникать и конкурировать сразу несколько гипотез, пытающихся объяснить один и тот же стимул.

Позже в беседе Лекс Фридман и Дилип Джордж подробно разберут математический аппарат вероятностных графических моделей и концепцию «вытеснения объяснений» (explaining away) на примере сработавшей сигнализации, однако эти аспекты инференса станут предметом рассмотрения в следующей главе статьи.

Нейробиология как инструмент инженерии: итеративный цикл построения ИИ 37:27

Для Дилипа Джорджа изучение структуры головного мозга — это не просто академический поиск ответов на биологические вопросы, а фундаментальный метод создания продвинутых систем искусственного интеллекта. Инженерный подход к проектированию ИИ нового поколения, по его мнению, должен строиться на жестком итеративном цикле. Этот цикл включает в себя последовательное изучение эмпирических данных нейробиологии, их перевод в строгие вычислительные математические модели и последующую экспериментальную проверку гипотез на практике. Только двигаясь по этому замкнутому контуру, ученые могут одновременно приблизиться к пониманию принципов работы мозга и создать по-настоящему эффективный ИИ.

В рамках этой методологии исследователи синтезируют биологические инсайты зрительной коры в компьютерные алгоритмы. Нейробиология выступает в роли источника архитектурных ограничений. Например, понимание принципов работы обратных и латеральных связей позволяет преодолеть ограничения классических сверточных сетей. Проектируя зрение, инженеры не должны рассматривать его в изоляции: восприятие и мышление в реальном мозге неразрывно переплетены. Нельзя создавать зрение как изолированный препроцессор для когнитивной системы — они должны быть совместимы изначально.

Одним из важнейших проявлений такого подхода является обеспечение нисходящей управляемости (top-down controllability) в моделях ИИ. Человек способен закрыть глаза и ментально манипулировать объектами, представляя детали текстуры или формы. Мы обладаем управляемым воображением. Дилип Джордж приводит примечательный пример: если спросить любого из нас, какого цвета буква «e» в официальном логотипе Google, мы вряд ли вспомним это со стопроцентной уверенностью, хотя видели этот логотип тысячи раз. Это доказывает, что человеческий мозг не хранит избыточные фотореалистичные образы. Вместо этого наша внутренняя модель оперирует концептуальными абстракциями, которые можно гибко комбинировать и видоизменять в уме. Именно эту особенность биологического зрения инженерам необходимо переносить в архитектуру интеллектуальных агентов.

В транскрипте интервью Дилип Джордж также ссылается на свою новую научную работу о кортикальных микросхемах, детально разбирает архитектуру сетей RCN, их способность взламывать CAPTCHA, свойства естественных сигналов и сравнение с искусственными CNN. Все эти специализированные технические концепты, микроструктуры колонок и прикладные робототехнические кейсы подробно раскрываются в третьей и четвертой главах нашего большого материала.

Нейробиология как лекало инженерии доказывает, что слепое копирование внешней структуры данных не ведет к успеху. Ключ к созданию сильного ИИ лежит в воспроизведении внутренних принципов обработки информации человеческой коры — её итеративности, концептуальности и способности строить гибкие причинно-следственные модели окружающего мира.

🧠 Динамический инференс и истинная архитектура зрения 51:02

Принцип «объяснения прочь» и динамический инференс 51:02

Современные искусственные нейросети, несмотря на свои впечатляющие успехи, не выполняют полноценный инференс (вывод) в режиме реального времени. То, что происходит в коммерческих моделях глубокого обучения, Дилип Джордж называет «амортизированным инференсом» (amortized inference). По сути, это попытка решить задачу рассуждения грубой силой: системы тренируют на колоссальных массивах данных, заставляя их просто запоминать все мыслимые комбинации признаков на этапе обучения. Биологический же мозг устроен принципиально иначе — он опирается на динамический инференс.

Динамический инференс работает как гибкая каузальная (причинно-следственная) система. На вершине этой иерархии находятся абстрактные причины — концепты и понятия, а у основания — сырые сенсорные данные, такие как пиксели на сетчатке глаза. Мозг непрерывно пытается объяснить входящий поток сигналов через активацию высокоуровневых причин. Этот процесс обладает собственной временной и логической динамикой: когда активируется определенное понятие, оно по механизму обратной связи начинает предсказывать или «включать» соответствующие ему пиксели на нижних уровнях.

Главное преимущество такого подхода — способность формировать исчерпывающее, интерпретируемое объяснение всей сцены, а не просто выдавать сухую вероятность класса. Когда правильно спроектированная ИИ-модель или человеческий мозг сталкиваются с объектом, они строят детальную каузальную карту:

Четко выделяют конкретные внешние контуры и внутренние поверхности объекта.
Определяют, какие именно элементы входного сигнала подтверждают гипотезу, а какие были «галлюцинированы» — то есть достроены воображением для полноты картины.
Безошибочно считывают пространственные отношения, определяя, какой объект находится на переднем плане, а какой частично скрыт за ним.

Интересно, что при таком подходе даже ошибки, совершаемые системой, оказываются поразительно похожими на те промахи, которые в аналогичных условиях допускает человеческое зрение.

Локальные противоречия и глобальный контекст 56:32

Как система справляется с визуальным шумом и искажениями? Ранее в разговоре Лекс Фридман и Дилип Джордж подробно обсуждали тесты CAPTCHA и возможности архитектуры RCN, и именно на примере феномена «скученности» символов ученый объясняет фундаментальные принципы работы нашего восприятия. Когда визуальные элементы расположены слишком близко и накладываются друг на друга, локальная информация становится обманчивой. Например, если буквы «r» и «n» напечатаны вплотную, на локальном патче изображения они будут выглядеть в точности как одна буква «m».

Обычная нейросеть прямого распространения неизбежно совершит ошибку, доверившись этому локальному признаку. Человеческий мозг разрешает подобные противоречия за счет интеграции локальных улик в глобальный контекст. Если буква «m» абсолютно не вписывается в контекст всего слова или противоречит глобальной структуре, зрение запускает механизм «объяснения прочь» (explaining away).

Мозг пересматривает локальные выводы под давлением целостной картины мира. Он устраняет конфликт, объясняя появление признаков буквы «m» как побочный эффект слияния двух независимых причин — «r» и «n». Подобная интеграция локального и глобального представляет собой базовую форму рассуждения и логического вывода, встроенную непосредственно в перцептивный аппарат.

Кортикальные принципы: почему мозг не использует свёртки 1:07:54

Разработка моделей, основанных на биологических принципах, часто сталкивается со скептицизмом со стороны мейнстримного сообщества машинного обучения. Однако Дилип Джордж уверен в фундаментальной ценности своего подхода. Он напоминает, что их прорывная работа была опубликована в престижном журнале Science, что подтверждает её строгую научную верификацию. Ученый твердо стоит за жизнеспособность идей, которые они объединили в единую когерентную систему: рекурсивный инференс, латеральные связи, обратная связь и топ-даун внимание.

В связи с этим Дилип вспоминает ироничный анекдот: когда их статья была принята, пресс-служба журнала Science, поддавшись всеобщей моде на хайп вокруг глубокого обучения, выпустила релиз с заголовком «Новая модель глубокого обучения взламывает CAPTCHA». И это при том, что авторы прямо заявляли в аннотации, что их разработка не является глубокой нейросетью, а представляет собой вероятностную графическую модель! Этот «эффект повального увлечения» (bandwagon effect) часто мешает исследователям мыслить нестандартно.

Для Дилипа «вдохновленный мозгом» ИИ — это не маркетинговая вывеска, а постоянное размышление над загадками биологии. Одним из главных примеров концептуального расхождения между ИИ и природой служат свёрточные нейросети (CNN). Вопреки распространенному заблуждению, зрительная кора человека не реализует операцию свёртки.

Хотя биологическое зрение задействует локальные рецептивные поля и локальную связность, в нем нет инвариантности к сдвигу (translational invariance) на уровне весов сети. В компьютерном зрении свёртка — это искусственный, пусть и гениальный вычислительный трюк для разделения весов, помогающий экономить ресурсы при обучении.

Анатомически мозг человека ориентирован на фовеа (fovea) — зону центрального зрения с максимальным разрешением. Из-за наличия фовеа нейронные веса в центре зрительного поля кардинально отличаются от весов на периферии. Дилип убежден, что этот инженерный трюк со свёртками полностью исчерпает себя, как только ИИ-агенты перешагнут рамки статичных датасетов и воплотятся в роботах с подвижными головами и глазами.

Согласно гипотезе кортикальных микросхем, кортикальные колонки кодируют абстрактные понятия как переменные. Связи между этими колонками и образуют гибкую структуру знаний о мире. Именно эта архитектура позволяет биологическим системам мгновенно переключаться между масштабами, подчиняя локальные сенсорные данные глобальному причинно-следственному выводу.

🧠 Эволюция Recursive Cortical Network и концептуальное мышление 1:15:13

Разработка по-настоящему интеллектуальных систем требует глубокого понимания принципов работы человеческого мозга, однако слепое копирование биологии может завести инженеров в тупик. Как отмечает Дилип Джордж, сверточные нейросети стали отличным трюком для повышения эффективности вычислений, но мозг использует принципиально иные механизмы. Вспоминая свой опыт работы над иерархической временной памятью в компании Numenta вместе с Джеффом Хокинсом, Дилип указывает на важную точку расхождения: он никогда не стремился жестко ограничивать свои алгоритмы критерием стопроцентного биологического правдоподобия, известного на тот момент. Наука регулярно открывает новые биофизические каналы и механизмы обучения в мозге, поэтому искусственное отсечение перспективных математических подходов было бы опасной ошибкой. Намного важнее уловить высокоуровневую суть процессов восприятия, чтобы эффективно переносить их в архитектуру ИИ.

Recursive Cortical Network: от зрительной коры к когнитивным программам 1:21:37

Модель Recursive Cortical Network (RCN) стала прорывным шагом на этом пути. Будучи вдохновленной принципами работы зрительной коры, RCN делает упор на сегментацию объектов, выделение их структурных частей и уникальных свойств. Это позволяет модели демонстрировать высочайшую точность распознавания при минимальных объемах данных для обучения. Когда Лекс Фридман интересуется развитием идей, лежащих за пределами RCN, Дилип Джордж объясняет, что его исследовательская группа стремится связать чистое восприятие с когницией — способностью формировать абстрактные понятия и строить логические рассуждения.

Результатом этой эволюции стала базовая когнитивная архитектура версии 0.1, описанная в публикации для журнала Science Robotics. В качестве практического применения ученые выбрали манипуляционную робототехнику. Представьте, что вам нужно объяснить человеку, не знающему вашего языка, задачу: собрать все красные чашки со стола. Вы можете показать ему картинку «до» и картинку «после». Человек мгновенно поймет концептуальную суть изменений. Дилип Джордж активно исследует это довербальное концептуальное понимание (pre-verbal conceptual understanding) — способность манипулировать абстракциями в голове без привязки к языку.

Архитектура когнитивных программ, разрабатываемая Дилипом, включает в себя несколько ключевых компонентов:

Управляемая перцептивная система для гибкого и точного сканирования окружения;
Схемы сетей (schema networks), моделирующие динамику и причинно-следственные связи физического мира;
Система обучения концептам, объединяющая эти элементы в исполняемые ментальные программы.

Такой подход кардинально отличается от извлечения простых статистических ассоциаций из терабайтов сырого текста. Дилип Джордж заявляет о своем полном несогласии с теорией универсальной грамматики Ноама Хомского, утверждающей, что язык лежит в самой основе мышления. Напротив, именно визуальные и моторные абстракции, формируемые в процессе взаимодействия с миром, служат обязательным пререквизитом для любого подлинного понимания.

В качестве иллюстрации Дилип приводит классический пример с фразой: «Салли забила гвоздь в потолок». Если спросить слушателя, как был ориентирован гвоздь — горизонтально или вертикально, человек уверенно выберет вертикальный вариант. Лекс Фридман соглашается, подтверждая, что при ответе он буквально представил и мысленно визуализировал всю сцену целиком. Это знание не заложено в самом тексте, оно извлекается из повседневного опыта, сохраненного в зрительной и моторной коре. Ранее в разговоре собеседники уже затрагивали кортикальные микросхемы и концепты, но именно здесь Дилип Джордж делает фундаментальный вывод: язык — это инструмент контроля симуляции (language is simulation control). Язык лишь посылает высокоуровневые запросы к мощному внутреннему симулятору, построенному на базе перцептивной системы.

Проблема CAPTCHA как фундаментальный вызов для восприятия ИИ 1:25:39

Дилип Джордж формулирует текущее состояние технологий следующим образом: «Восприятие — это первая вещь, которую нам необходимо построить, но это последняя вещь, которая будет окончательно разгадана и решена». Наглядным полем битвы, обнажающим пропасть между человеческим зрением и классическим машинным обучением, остается проблема CAPTCHA. Данный тест сохраняет статус важнейшего вызова для систем ИИ именно потому, что требует от алгоритма способности мгновенно адаптироваться к незнакомым стилям, искажениям, зашумлению и наложению объектов друг на друга без предварительного обучения на конкретных паттернах.

Человек считывает искаженный текст на CAPTCHA без усилий, поскольку его зрительная кора оперирует инвариантными концептами деталей и структуры, что и легло в основу Recursive Cortical Network. Архитектура RCN эффективно сегментирует изображение, определяя границы, формы и взаимное расположение элементов, что позволяет ей решать CAPTCHA с феноменальной точностью, обходясь мизерным набором обучающих сэмплов. В то же время стандартные нейросети глубокого обучения требуют миллионов примеров и мгновенно ломаются, стоит авторам CAPTCHA слегка изменить геометрию шрифта или добавить новый тип шума.

В ходе беседы Лекс Фридман и Дилип Джордж детально разбирают этот феномен на примере ограничений масштабных языковых моделей вроде нашумевшей GPT-3. Несмотря на впечатляющую способность генерировать связный текст, такие гиганты не несут в себе стабильного состояния мира и не способны запускать внутренние симуляции для проверки истинности суждений. Дилип подчеркивает, что масштабирование трансформеров создает лишь иллюзию понимания в рамках «текстового мира». Отсутствие механизмов обратной связи лишает их возможности осуществлять полноценный каузальный анализ. Дилип делится шуткой из своего Твиттера: система прочитала все труды по квантовой механике и теории относительности, а мы используем её для автодополнения текста и решения примитивных головоломок. Возвращаясь к урокам CAPTCHA и RCN, Дилип Джордж резюмирует, что без интеграции глубокого, управляемого восприятия с когнитивной симуляцией, чисто статистический подход «больших, но глупых» сетей неизбежно упрется в непреодолимый концептуальный тупик.

🤖 Трансформеры и предел статистического интеллекта 1:40:38

В современной индустрии ИИ доминирует подход, основанный на масштабных статистических моделях, таких как GPT-3 или архитектуры трансформеров. Однако Дилип Джордж (Dileep George) указывает на фундаментальную проблему: эти системы, несмотря на их впечатляющие результаты в обработке текста, лишены того, что составляет основу человеческого интеллекта — глубокой, структурной модели мира . Без такой модели ИИ остается заложником статистических корреляций, неспособным к истинному пониманию причинно-следственных связей.

Ловушка статистических паттернов 1:41:05

Разбирая архитектуру когнитивных систем, Дилип Джордж выделяет два критически важных типа памяти. Первый тип — это хранилище статистических паттернов, извлекаемых из окружающего мира в течение долгого времени . Второй — это эпизодическая память (подробно обсуждаемая в контексте гиппокампа позже в беседе), которая фиксирует уникальные события, происходящие лишь однажды .

Проблема современных языковых моделей заключается в том, что они почти полностью полагаются на первый тип — статистику. Они великолепно предсказывают следующее слово в предложении или следующий кадр в видео, основываясь на гигантских массивах данных. Однако:

Статистические модели не понимают структуры ситуации.
Они не умеют эффективно индексировать уникальный опыт относительно общей модели мира .
Они ограничены «плоским» представлением данных, в то время как мозг использует иерархическую структуру для индексации сходств и различий .

По мнению эксперта, для создания настоящего ИИ недостаточно просто наращивать количество параметров в нейросетях. Необходимо внедрять в них больше структуры и механизмов, поддерживающих динамический инференс — способность системы активно тестировать гипотезы и обновлять свои представления в реальном времени .

Отсутствие модели мира и проблемы контрфактуального мышления 1:44:35

Одной из главных претензий к текстовым моделям является их неспособность к активному инференсу и контрфактуальному мышлению. В то время как трансформеры пассивно обрабатывают входные данные, человеческий интеллект работает в двунаправленном режиме . Мы постоянно прогоняем в голове сценарии «а что, если?», используя внутреннюю модель мира для симуляции действий без их фактического совершения.

Дилип Джордж отмечает, что будущее за гибридными подходами, которые объединяют сильные стороны нейросетей и графических моделей . Графовые нейронные сети (GNN) — это лишь первый шаг в этом направлении. Истинный прогресс требует систем, способных:

Формировать причинно-следственные структурные модели .
Использовать эти модели для объяснения данных, а не просто для классификации.
Осуществлять «викарное» обучение — проигрывание опыта внутри себя для планирования будущих действий .

Это тесно связано с понятием осознанности как инструмента самомоделирования (тема, которой собеседники коснутся в финальной части интервью), где система применяет свой аппарат моделирования не только к внешнему миру, но и к своим собственным процессам .

Уроки авиации: почему «махать крыльями» — это не ИИ 2:00:18

В дискуссиях об ИИ часто используют аналогию с самолетами: «Самолеты не машут крыльями, как птицы, но они летают. Значит, ИИ не должен копировать мозг» . Дилип Джордж считает этот аргумент ироничным и часто неверно истолкованным. История братьев Райт, подробно описанная в книге «Голос епископа» (Bishop's Voice), доказывает обратное .

Братья Райт совершили прорыв именно потому, что внимательно наблюдали за птицами . Они не пытались слепо копировать махание крыльями (аналог чистого статистического подражания в ИИ). Вместо этого они вычленили фундаментальный принцип — контроль. Они заметили, как коршуны парят в потоках воздуха, слегка меняя форму крыла для стабилизации .

Для современного ИИ этот урок означает следующее:

Пропульсия (мощность) — это вычислительные мощности и объемы данных. Многие считали, что достаточно просто поставить мощный двигатель, чтобы взлететь .
Контроль (интеллект) — это понимание принципов управления и структуры. Братья Райт поняли, что если решить проблему контроля, то проблема тяги решится сама собой .

Сегодняшние нейросети напоминают самолеты с мощными двигателями, но без внятной системы управления. Они «машут крыльями» статистики, пытаясь взлететь за счет грубой силы вычислений. Однако для создания систем, способных к сложному рассуждению, инженерам нужно вернуться к изучению биологического «чертежа» — архитектуры коры головного мозга .

В завершение разговора о карьере в ИИ Дилип Джордж советует молодым исследователям выбирать путь электротехники или компьютерных наук . Изучение схемотехники, микропроцессоров и обработки сигналов дает правильный инструментарий для того, чтобы не просто наблюдать за интеллектом как естествоиспытатель, а проектировать его как инженер, понимающий глубинные функциональные принципы системы .

🧠 Смысл жизни, программирование и архитектура разума 2:05:34

Эпизодическая память как индекс восприятия 2:05:46

В финальной части глубокого диалога Лекс Фридман и Дилип Джордж обращаются к прикладным и философским аспектам взаимодействия человека с информацией. Дилип Джордж выражает твердое убеждение в том, что в современную эпоху абсолютно каждый ученый, независимо от его конкретной дисциплины, должен освоить навыки программирования. По его мнению, владение инструментами написания кода кардинально меняет правила игры: оно передает колоссальные массивы данных прямо «в руки» исследователю, позволяя моментально систематизировать их, находить неочевидные взаимосвязи и извлекать скрытые смыслы. Умение писать код избавляет от зависимости от устаревшего софта и медленных методологий, открывая путь к самостоятельному конструированию сложных систем.

Этот сугубо инженерный подход к упорядочиванию данных на удивление точно отражает внутреннюю архитектуру человеческого разума, в частности работу эпизодической памяти. Эпизодическая память функционирует в нашем мозге не как архив статичных видеозаписей, а как динамический индекс или упорядоченная временная последовательность. Главная задача этого механизма — позволить кортексу (коре головного мозга) осуществлять «реинсценировку» или ментальное воспроизведение прошлого опыта. Мозг обращается к сохраненным меткам, чтобы заново проиграть определенные ситуации, извлечь из них уроки и использовать полученные выводы для эффективного обучения и принятия решений в будущем.

Будущее нейроинтерфейсов (BCI) и биологические барьеры 2:06:53

Понимание принципов работы кортекса неизбежно подводит современную науку к попыткам прямого объединения живой ткани и кремниевых чипов, создавая интеллектуальные системы нового поколения. Интерфейсы мозг-компьютер (BCI) на сегодняшний день признаются одним из наиболее многообещающих технологических векторов развития ИИ. В краткосрочной перспективе их терапевтический потенциал выглядит колоссальным: они способны возвращать подвижность парализованным людям и помогать в лечении тяжелейших дегенеративных заболеваний центральной нервной системы. Однако переход от медицинских лабораторий к массовому повседневному использованию BCI сопряжен с препятствиями фундаментального характера.

Как мимоходом отмечает Лекс Фридман, ранее в разговоре они уже детально касались темы человеческой смертности и биологической уязвимости. Интеграция искусственных устройств в живую структуру мозга сталкивается с колоссальной проблемой биологической адаптации и долгосрочной безопасности. Мозг является чрезвычайно пластичной, но в то же время защищенной средой для любых инородных тел. Разработка интерфейсов, способных десятилетиями стабильно функционировать внутри черепной коробки без причинения вреда здоровью, остается одним из сложнейших вызовов для инженеров.

Природа интеллекта и конструирование смысла жизни 2:07:08

Любая интеллектуальная система по своей сути является целеустремленной и движимой конкретными задачами. Опираясь на этот постулат, Лекс Фридман переводит дискуссию в русло экзистенциальной философии и спрашивает Дилипа Джорджа о том, под управлением каких глобальных целей функционирует человеческий мозг и в чем заключается подлинный смысл жизни. Ответ Дилипа Джорджа звучит поразительно оптимистично и свободно: смысл жизни — это не предзаданная извне догма, а открытый конструкт, который каждый человек создает для себя самостоятельно. В этой системе координат нет жестких космических предписаний, пространство выбора абсолютно свободно и открыто для индивидуального творчества.

При этом сама природа когнических способностей и интеллекта имеет вполне осязаемую, эволюционно обоснованную цель. Интеллект предназначен для того, чтобы досконально изучить и понять «механику» окружающего мира, его скрытые причинно-следственные связи и законы. На базовом уровне это необходимо для банального выживания — чтобы ориентироваться в пространстве, обеспечивать безопасность и попросту не погибать. Однако на более высоком уровне понимание устройства вселенной служит универсальным фундаментом: разобравшись в том, как работают механизмы реальности, человек обретает инструмент для эффективного достижения абсолютно любых целей, которые он сам перед собой поставит. Все остальные надстройки бытия, как подчеркивает Дилип Джордж, являются лишь продуктом сиюминутных желаний или веяниями популярной в данный момент культуры.

Лекс Фридман признает эту мысль идеальной и вдохновляющей точкой для завершения их масштабного диалога. В финале подкаста ведущий тепло благодарит Дилипа Джорджа за потрясающую беседу, упоминает спонсоров выпуска и прощается со слушателями, цитируя бессмертные слова римского императора-стоика Марка Аврелия: «Вы имеете власть над своим разумом, а не над внешними событиями. Осознайте это, и вы обретете силу».