Предел нейросетей: почему нам нужны гибридные системы ИИ

Нейросети, какими мы их знаем сегодня, обречены на вечное «копирование» прошлого, так как их природа — лишь математическая интерполяция данных, а не истинное мышление. Чтобы достичь подлинного интеллекта, способного к адаптации в условиях полной неопределенности, нам придется отказаться от культа вычислительной мощности в пользу гибридных систем, объединяющих интуитивное восприятие с жесткой дискретной логикой.

🧠 Природа интеллекта и геометрические пределы глубокого обучения 0:12

Что такое интеллект: сила обобщения и способность к абстракции 0:12

Определение природы интеллекта остается фундаментальным вызовом для когнитивной науки и ИИ. Франсуа Шолле (Francois Chollet) постулирует, что истинный интеллект неотделим от способности к генерализации — обобщению имеющегося опыта для успешного взаимодействия с принципиально новыми ситуациями. По его мнению, любая сложная система по достижении определенного уровня начинает напоминать живой organism, и для создания сильного ИИ необходимо оптимизировать саму способность к обобщению. Интеллект характеризует соотношение между уже известной информацией и бесконечным пространством будущих непредвиденных ситуаций. По сути, сила интеллекта — это чуткость к абстрактному анализу, умение находить изоморфизмы и строить аналогии.

Шолле критикует подход, измеряющий прогресс ИИ через фиксацию на конкретных задачах вроде шахматных алгоритмов, где правила неизменны и адаптация к новизне не требуется. Настоящая интеллектуальная система должна эффективно конвертировать накопленный опыт в новые навыки без помощи инженера. Ранее в разговоре ведущие касались теста ARC Challenge как бенчмарка и развития библиотеки Keras, которые будут подробно разобраны в четвертой главе статьи, однако уже на этом этапе Шолле подчеркивает антропоцентричность человеческих априорных знаний. Интеллект — это воплощенный динамический процесс, где способность справляться с неопределенностью является главным критерием разумности. Также Франсуа Шолле скептически упоминает концепцию «интеллектуального взрыва», подробный критический разбор которой будет представлен в пятой главе.

Границы нейросетевого подхода и дискретное мышление 3:04

Современный триумф глубокого обучения создал иллюзию его универсальности, однако Франсуа Шолле очерчивает жесткие математические границы этой технологии. Глубокое обучение идеально подходит для непрерывных задач, где данные можно интерполировать внутри гладкого многообразия при условии их плотной выборки. Но как только система сталкивается с необходимостью дискретного алгоритмического мышления, нейросети пасуют. В то время как глубокое обучение позволяет строить сложнейшие программы, оно одновременно терпит крах при попытке воспроизвести простейшие дискретные алгоритмы.

Примером такой уязвимости является неспособность нейросетей безошибочно предсказать знаки числа пи, простые числа или отсортировать список. Шолле утверждает, что около 99% всего современного программного обеспечения носит чисто алгоритмический характер, и поэтому глубокое обучение для него — худший выбор. Попытки решить такие задачи нейросетями приводят к хрупким и требующим колоссального объема данных репрезентациям. Нейросети технически являются конечными автоматами, способными лишь аппроксимировать безграничные алгоритмы, при этом неизбежно допуская случайные ошибки. Ведущие также вскользь упоминают дискретный синтез программ и ограничения модели GPT-3, детальный разбор которых авторы отложили для второй главы.

Гипотеза многообразия: почему глубокое обучение работает 6:16

Ключ к пониманию успехов и неудач нейросетей лежит в гипотезе многообразия данных (manifold hypothesis). Согласно ей, естественные данные формируют низкоразмерные многообразия внутри многомерного пространства эмбеддингов. Задача алгоритма классификации в такой парадигме — буквально распутать и разделить эти сложные геометрические структуры. Франсуа Шолле объясняет, что глубокое обучение способно обобщать информацию исключительно благодаря интерполяции на таких многообразиях. Однако геометрия данных должна быть непрерывной и доступной для обучения (learnable).

Если многообразие содержит сложные разрывы, метод градиентного спуска оказывается бессилен: сеть скатывается в тривиальное зазубривание обучающей выборки. Модель глубокого обучения можно представить как многомерную кривую, чья структура ограничена индуктивными априорными допущениями. В процессе стохастического градиентного спуска (SGD) этот изгиб постепенно настраивается, находя оптимальное положение между недообучением и переобучением. Шолле метафорически называет такие модели локально-чувствительными хеш-таблицами, способными сопоставлять объекты за счет вычисления расстояний между ними. Именно поэтому глубокое обучение идеально справляется с задачами восприятия (perception), но абсолютно неприменимо там, где требуется явное пошаговое рассуждение.

Интерполяция против экстраполяции: великий спор о генерализации 8:00

Фундаментальное ограничение современных архитектур ИИ заключается в том, что они являются исключительно интерполяторами. Они не способны осуществлять полноценную экстраполяцию — выход за пределы выпуклой оболочки обучающих данных. Яркой иллюстрацией служит тот факт, что нейросетям крайне тяжело экстраполировать простейшую скалярную функцию идентичности $f(x) = x$ вне знакомого диапазона значений. За пределами обучающей выборки многообразие данных превращается в нить, уходящую в бесконечность, о свойствах которой алгоритму ничего не известно. Из-за этого модели генерации изображений демонстрируют катастрофическую хрупкость даже при рисовании простых прямых линий.

В рамках дискуссии позиция Шолле сталкивается с мнением Яна Лекуна, утверждающего, что в высокомерных пространствах все машинное обучение является экстраполяцией. Лекун указывает, что в пространстве цветных изображений даже миллион примеров покрывает лишь ничтожную долю осей, поэтому любой новый образ требует экстраполяции. Однако Шолле парирует: то, что кажется экстраполяцией в сыром пространстве данных, на самом деле является строгой интерполяцией на выученном скрытом многообразии. Вне этой топологии экстраполяция нейросети без жестко заданного математического правила не имеет смысла и эквивалентна добавлению случайного шума к ближайшему известному примеру.

🧩 Дискретный синтез программ против ограничений непрерывных нейросетей 25:28

Непрерывные манифольды против дискретной логики: кейс с умножением 25:28

Франсуа Шолле подробно разбирает глубинное противоречие между непрерывной природой глубокого обучения и дискретным характером алгоритмов. Существует устойчивое заблуждение, будто нейросети в общем смысле полны по Тюрингу. Однако Шолле опровергает это: стандартные конечные нейросети, которыми оперирует индустрия, не имеют доступа к неограниченной памяти и времени вычислений. Невозможность полноценно закодировать бесконечный алгоритм в конечной сети приводит к экзогенному росту числа параметров моделей ради банальной компенсации этой ограниченности. Истинная сложность заключается в обучаемости: при попытке аппроксимировать многообразие с помощью градиентного спуска на стыке дискретных структур возникают критические разрывы, где градиенты просто перестают работать.

Для иллюстрации Шолле вспоминает пример 2015 года, когда его коллега использовал библиотеку Keras для обучения модели LSTM умножению чисел, передаваемых в виде текстовых строк. Модель пыталась воспроизвести классический алгоритм умножения в столбик, которому учат в начальной школе. Несмотря на то, что сеть справилась с задачей, Шолле указывает на три фундаментальных изъяна такого подхода. Во-первых, для обучения простейшей логике потребовались тысячи примеров. Во-вторых, непрерывное представление дискретного объекта неизбежно порождает аппроксимационные ошибки — «глитчи» (подобно искажениям вокруг острых углов при преобразовании Фурье), из-за чего точность падает до 95%. В-третьих, такая модель способна исключительно на локальную генерализацию: успешно перемножая трехзначные числа, она полностью проваливается на пятизначных. Попытка же адаптировать её под новую длину (few-shot fine-tuning) потребует не пару примеров, а миллионы новых данных.

Дискретный поиск программ и сильная генерализация 31:08

В противовес неэффективности непрерывных сетей Шолле выдвигает дискретный синтез программ, осуществляющий целенаправленный поиск в пространстве предметно-ориентированных языков (DSL). Если решать ту же задачу умножения через движок дискретного поиска с простейшим DSL, содержащим базовые циклы и операции сложения, система найдет точное решение всего по пяти примерам вместо тысяч. Полученный алгоритм будет абсолютно точным, легким в исполнении и, что самое главное, способным к сильной генерализации. Достаточно изменить пару строк сгенерированного кода, чтобы программа масштабировалась с трехзначных чисел на семизначные.

Ранее в разговоре собеседники подробно затрагивали природу генерализации, разделяя интерполяцию и экстраполяцию. В контексте этого Шолле отмечает, что для чисто перцептивных задач (таких как распознавание цифр из датасета MNIST), где данные гладко распределены, глубокое обучение незаменимо, тогда как программный синтез оказывается слишком хрупким. Однако в дискретной алгоритмической среде попытка отсортировать список с помощью нейросети выглядит абсурдно: это требует искусственного насаждения индуктивных приор и ведет к банальному заучиванию обучающей выборки.

Ловушка мотивированного мышления и жесткие лимиты GPT-3 33:56

Рассуждая о том, почему столь очевидные выводы игнорируются мейнстримом ИИ-сообщества, Шолле указывает на ловушку «мотивированного мышления». Эксперты, построившие карьеру на глубоком обучении, имеют прямой шкурный интерес верить в универсальность своей технологической парадигмы. Шолле иронизирует над собственными надеждами: работая в этой сфере почти десять лет, он сам страстно желал бы, чтобы глубокое обучение мгновенно привело к созданию сильного ИИ человеческого уровня.

Отражением этих неоправданных ожиданий стал хайп вокруг модели GPT-3. Шолле признается, что поначалу был искренне заинтригован заявлениями о способности языковых моделей к генерализации «с ходу» (few-shot). Это напоминало известную научную сенсацию о фиксации нейтрино, превысивших скорость света, которая в итоге оказалась банальной ошибкой измерительного оборудования. Тщательный анализ систем класса GPT-3 подтвердил худшие опасения Шолле: эти модели способны извлекать и комбинировать алгоритмы из колоссального массива тренировочных данных, но они принципиально не могут синтезировать новые алгоритмы на лету для тех паттернов, которые они ранее не встречали. В коде и весах GPT-3 уже зашито огромное количество элементарных алгоритмов. Модель оперирует ими как готовыми блоками, но столкновение с незнакомой структурой делает её абсолютно беспомощной. Позже в дискуссии будет подробно рассмотрен бенчмарк ARC, но Шолле уже здесь констатирует полную неэффективность GPT-3 в подобных тестах именно из-за неспособности к динамическому синтезу.

Геометрия против топологии и направляющая роль нейросетей в поиске 40:20

Разрешение этого кризиса Шолле видит в признании дуализма мышления, аналогичного человеческому разделению на Систему 1 (интуиция) и Систему 2 (рассуждение). Проводящий доказательство математик строит строгую цепочку дискретных шагов (Система 2), однако траектория его мысли направляется высокоуровневой непрерывной интуицией (Система 1), позволяющей видеть финальную точку без пошагового вывода. Аналогично водитель на дороге сочетает дискретный выбор поворотов на сетевом графе улиц с непрерывным геометрическим восприятием расстояний и направлений на карте.

В основе любого интеллекта лежит абстракция, рождающаяся через аналогию. Шолле разделяет два фундаментальных паттерна сопоставления реальности:

Геометрический подход (Система 1), оперирующий расстояниями в непрерывных векторных пространствах, где объекты представлены точками. На этом фундаменте строятся шаблоны, кластеры и все современное глубокое обучение.
Топологический подход (Система 2), сфокусированный на точном структурном соответствии и поиске изоморфизма подграфов, где сущности изначально дискретны.

Опираясь на гипотезу калейдоскопа (kaleidoscope hypothesis), согласно которой все разнообразие вселенной соткано из ограниченного набора простейших повторяющихся «атомов структуры», Шолле утверждает, что истинный интеллект — это способность осуществлять реверс-инжиниринг мира ради извлечения этих базовых абстракций. Именно поэтому магистральным путем развития технологий Шолле считает архитектуры, ориентированные на дискретный поиск программ. В такой связке ключевая роль отдается дискретному поиску на базе DSL, в то время как нейросетевые движки выполняют строгую направляющую функцию — формируют первичные перцептивные абстракции и радикально сужают пространство поиска, избавляя алгоритм от комбинаторного взрыва.

🧠 Измерение интеллекта: между когнитивными инструментами и дилеммой «белого ящика» 54:34

Синергия непрерывного и дискретного: как мозг аппроксимирует геометрию 54:34

Хотя ранее в разговоре затрагивались ограничения глубокого обучения и общая природа гибридных систем ИИ, Франсуа Шолле предлагает подробнее разобрать качественные различия между полюсами когнитивных процессов. Отвечая на вопрос о том, существует ли непрерывный спектр между мышлением типа 1 (быстрым, интуитивным) и типа 2 (медленным, логическим), ученый отмечает, что они представляют собой качественно разные полюса когниции. Тем не менее, большинство повседневных ментальных операций человека представляют собой не промежуточные состояния, а прямую комбинацию обоих механизмов.

Шолле делится своей субъективной гипотезой о работе человеческого мозга, которая пока не подкреплена эмпирическими доказательствами: фундаментально биологический разум реализует синергию непрерывного и дискретного, основывая геометрию мышления на дискретной структуре. Математически гораздо проще аппроксимировать непрерывное геометрическое пространство с помощью дискретных конструктов, чем пытаться встроить сложные дискретные программы в гладкое многообразие. В качестве аналогии ведущие приводят примеры из классической математики и программирования:

В задачах смешанного целочисленного программирования дискретную проблему часто проецируют в непрерывное пространство для непрерывной оптимизации, а затем снова дискретизируют на финальном этапе.
Гамма-функция служит непрерывным обобщением дискретного факториала, сглаживая переходы между изолированными точками на графике.

Шолле убежден, что будущие архитектуры искусственного интеллекта неизбежно станут бинарными в своей основе: они будут сочетать градиентный спуск для непрерывного поиска паттернов и движок дискретного поиска для логических программ.

Манифест «On the Measure of Intelligence» как концептуальный инструмент 1:01:37

Переходя к методологии оценки ИИ, Франсуа Шолле призывает правильно интерпретировать его фундаментальную работу «On the Measure of Intelligence» («О намерении измерить интеллект»). Стороннему наблюдателю может показаться, что создание теста ARC преследовало цель построить безупречную линейку для измерения машинного разума. Однако Шолле подчеркивает, что его публикация — это прежде всего «когнитивный инструмент» (cognitive device), призванный переформатировать мышление исследователей и устранить давние концептуальные заблуждения, тормозившие индустрию.

По мнению Шолле, любая хорошая научная дефиниция должна быть прагматичной и применимой на практике:

Она обязана подсвечивать ключевые фундаментальные вызовы, а не маскировать их.
Она должна обеспечивать четкий и действенный сигнал обратной связи, направляющий разработчиков к созданию более гибких систем.

Сам по себе существующий набор задач ARC не является финальной точкой или абсолютным мерилом интеллекта; это развивающийся проект (work in progress), который будет дорабатываться по мере обнаружения скрытых изъянов и уязвимостей.

Дилемма «белого ящика» и истинная адаптивность 1:04:02

Один из самых острых вопросов дискуссии касается необходимости «белого ящика» (white-box analysis) при тестировании систем. Ведущий предлагает мысленный эксперимент с путешествиями во времени: если алгоритм из будущего, в который заранее заложили ответы на все тесты ARC, прислать в прошлое, он безупречно справится с заданиями. Внешне он покажется разумным, но это будет иллюзией, ведь система просто использует готовые знания, а не генерирует новые решения на лету.

Франсуа Шолле соглашается с этим аргументом и формулирует фундаментальное ограничение: поскольку интеллект определяется как коэффициент эффективности конверсии априорных знаний (priors) и опыта в новые навыки, вычислить его невозможно без точного понимания стартовых условий. Чисто поведенческий подход «черного ящика» здесь бессилен.

В качестве примера Шолле указывает на мир насекомых: многие из них способны демонстрировать поразительно сложные паттерны поведения, но их нельзя назвать высокоинтеллектуальными, поскольку они мгновенно теряются, если их вытолкнуть из эволюционной зоны комфорта. Настоящий интеллект — это способность адаптироваться к радикально новым, непредвиденным ситуациям. Чтобы верифицировать эту способность у ИИ, ученым необходим контролируемый эксперимент, где четко зафиксированы базовые знания (core knowledge priors) и жестко ограничено количество примеров для обучения.

Сложность генерализации против истинного хаоса 1:10:04

Обсуждая математические границы адаптивности, собеседники затрагивают проблему разграничения содержательной сложности и тривиального шума. При случайном отображении множества целых чисел в бинарные значения алгоритмическая сложность возрастает до предела, превращая программу в громоздкую хэш-таблицу.

Шолле признает, что случайность увеличивает общую сложность генерализации, но делает это неинтересным для науки образом. Простое повышение устойчивости модели к хаосу не приближает нас к сильному ИИ. Гораздо важнее тестировать чувствительность системы к тонким аналогиям (subtle analogies). Архитектура должна сталкиваться с неожиданными ситуациями, которые логически вытекают из ее прошлого опыта, но требуют оригинального перекомбинирования абстракций, а не бездумной фильтрации шума.

Эволюция задач: краудсорсинг и генеративно-обучающие системы будущего 1:11:58

В финальной части сегмента обсуждается идея создания саморегулирующейся экосистемы для развития ИИ. Ведущие предлагают концепцию рынка или соревновательной среды, где одни агенты создают новые задачи, а другие пытаются их решить.

Шолле подтверждает, что подробно описал подобную двухкомпонентную систему в конце своей работы об измерении интеллекта. Идея заключается в динамической оптимизации учебной программы (curriculum optimization), напоминающей взаимодействие учителя и ученика: нейросеть-генератор должна создавать задачи, сложность которых находится строго на грани текущих возможностей обучаемой системы. Они не должны быть ни слишком простыми, ни невыполнимыми, гарантируя максимальный когнитивный рост.

Главный подвох такой схемы — ее замкнутость и риск зацикливания. Согласно принципу сохранения сложности (conservation of complexity), системе необходим внешний источник усложнения, заземленный в реальном мире. На текущем этапе все задачи ARC Шолле придумывает вручную, что создает бутылочное горлышко и субъективную предвзятость. Для преодоления этого ограничения планируется масштабный краудсорсинг задач от сотен людей, чей мозг сформирован реальным миром. Это позволит расширить тестовую базу ARC v2 более чем в 10 раз и превратить статичный бенчмарк в непрерывный глобальный вызов.

🚀 Эволюция Keras и истинная генерализация в зеркале ARC 1:15:41

ARC Challenge: новый стандарт генерализации и мост к психометрике 1:15:41

Франсуа Шолле (Francois Chollet) отмечает, что разработанный им бенчмарк ARC (Abstraction and Reasoning Corpus) изначально проектировался для проверки способности ИИ к генерализации на совершенно новых задачах, принципиально неизвестных создателям системы. Поскольку ARC является полностью открытым проектом со свободной лицензией, вокруг него быстро сформировалась активная независимая экосистема. На рынке уже появилось несколько мобильных приложений, в которых обычные пользователи ради развлечения решают эти логические головоломки, что доказывает их интуитивность для человеческого восприятия.

Однако ключевая научная ценность бенчмарка лежит гораздо глубже — в возможности сопоставить результаты систем искусственного интеллекта с классическими психометрическими тетами для людей. Франсуа Шолле делится новостями с недавнего специализированного воркшопа на конференции AAAI, где две независимые исследовательские группы представили свои передовые наработки. Профессиональные команды нейропсихологов из Нью-Йоркского университета (NYU) и Массачусетского технологического института (MIT) теперь используют задачи ARC для проведения психологических экспериментов нового типа, исследуя базовые механизмы человеческого мышления.

Необходимость в таком фундаментальном подходе обусловлена действием «правила ярлыков» (shortcut rule). Ранее в разговоре собеседники детально обсуждали природу интеллекта, но именно здесь Шолле формулирует важную закономерность: если система искусственного интеллекта оптимизируется под конкретную узкую метрику, она неизбежно находит обходные пути вместо освоения реальных навыков адаптации. Ярким примером служат классические шахматные программы или решения-победители на платформе Kaggle, которые максимизируют позиции в лидерборде в ущерб всем остальным важным характеристикам.

Оптимизация под одну цель приводит к созданию систем, которые демонстрируют серьезные провалы по ключевым инженерным параметрам:

Кодовая база таких решений становится абсолютно нечитаемой и непригодной для долгосрочной поддержки.
Алгоритмы крайне неэффективны с вычислительной точки зрения и практически неприменимы в условиях реального продакшена.
Модели полностью лишены объяснимости и прозрачности принимаемых решений.

Шолле убежден, что подлинный сильный искусственный интеллект (AGI) не родится внутри коммерческих систем таргетинга рекламы или закрытых военных симуляторов, поскольку жесткие целевые метрики всегда ведут лишь к гиперспециализации. Для создания общего интеллекта необходимо целенаправленно оптимизировать системы под генерализацию как таковую, работая в условиях экстремальной новизны и непредсказуемости.

Развитие Keras: преодоление барьеров и прогрессивное раскрытие сложности 1:16:59

Помимо разработки методологий измерения интеллекта, Франсуа Шолле широко известен в мировом сообществе как создатель популярной библиотеки Keras. Опровергая поверхностное мнение о том, что проект остался в эпохе TensorFlow 1 и старых графовых вычислений, Шолле подчеркивает: Keras остается живым, непрерывным и активно развивающимся проектом на протяжении последних шести лет. Аудитория фреймворка стабильно растет как во всем мире, так и внутри компании Google, где инженерные команды массово мигрируют со старых инструментов на современные стандарты Keras. Важнейшим достижением Шолле считает сохранение преемственности дизайна: код образца 2015 года остается концептуально узнаваемым, несмотря на колоссальное расширение функционала.

Интеграция Keras в экосистему TensorFlow 2 не привела к его растворению, а напротив, позволила полноценно реализовать парадигму «прогрессивного раскрытия сложности» (progressive disclosure of complexity). В ранние годы разработчики неизбежно натыкались на жесткий барьер бэкенда. До тех пор, пока инженер использовал стандартный высокоуровневый интерфейс в стиле Scikit-Learn, разработка шла быстро и продуктивно, но любая потребность в глубокой кастомизации приводила к резкому падению на уровень сложных низкоуровневых абстракций базового движка.

Объединение инструментов уничтожило этот барьер. Теперь Keras предлагает бесшовную среду, позволяющую гибко кастомизировать отдельные шаги обучения, смешивая высокоуровневые конструкции с низкоуровневым кодом TensorFlow на том уровне абстракции, который необходим для конкретной задачи.

Экосистема фреймворков: перспективы JAX, PyTorch и градиентный спектр 1:20:49

В ответ на запросы ИТ-сообщества о возможном возвращении классических идей Theano на базе новых технологий JAX и XLA, Франсуа Шолле дает высокую оценку этим инициативам. Он называет JAX великолепным, элегантным и мощным проектом, создатели которого проделали выдающуюся работу. Тем не менее, Шолле реалистично оценивает текущее положение дел: реальный уровень адаптации JAX за пределами Google пока минимален, да и внутри корпорации им пользуется лишь скромная фракция исследователей.

Современная стратегия развития Keras полностью исключает старую модель жестких интерфейсных бэкендов. Подобные архитектурные «обрывы» опасны тем, что они создают изолированные силосы пользователей, разделяя сообщество на тех, кто пишет только на высоком или только на низком уровне. Идеалом Шолле является создание плавного градиентного спектра абстракций.

Хотя гипотеза глобального интеллектуального взрыва осталась за рамками текущего практического разбора, Шолле напоминает, что именно правильная архитектура инструментов разработки играет ключевую роль в поиске путей к настоящей generality. Теоретически полная реимплементация спецификации API Keras поверх JAX могла бы стать отличным решением, реализующим аналогичный градиент, однако для основной команды этот вектор имеет низкий приоритет. Шолле признается, что с радостью написал бы такую интеграцию сам, будь у него достаточно свободного времени, но сейчас все ресурсы сфокусированы на поддержке и развитии оригинального Keras для его огромной и постоянно растущей пользовательской базы.

🧠 Путь к сильному ИИ: гибридные системы и переосмысление прогресса

Будущее искусственного интеллекта, по мнению Франсуа Шолле, лежит не в бесконечном масштабировании существующих архитектур, а в создании гибридных систем. Такие системы должны гармонично объединять два ключевых режима мышления: интуитивное восприятие (аналог Системы 1 по Канеману) и дискретный логический поиск (Система 2).

Современные нейронные сети превосходно справляются с задачей «перцептивного слоя» — они быстро распознают паттерны и абстракции в данных. Однако для достижения более высокого уровня интеллекта этого недостаточно. Необходим надстроечный слой дискретного поиска, который мог бы целенаправленно проверять гипотезы, используя базовые знания. В какой-то степени этот принцип уже реализован в таких системах, как AlphaZero, где нейросети направляют поиск в пространстве возможных действий.

Однако Шолле предлагает более глубокий подход: вместо жестко запрограммированного поиска в специфической среде, ИИ должен использовать дискретный язык программирования (DSL) для формирования новых функций и абстракций «на лету». Таким образом, вместо простого обучения весов, система учится модульности, создавая библиотеку кода, решающую конкретные подзадачи, что приближает ИИ к принципам человеческого инженерного мышления. Настоящий вызов заключается в том, чтобы сделать эти компоненты — восприятие и поиск — по-настоящему интегрированными и обучаемыми как единое целое.

📉 Мифы об «интеллектуальном взрыве»

В ходе дискуссии Франсуа Шолле подвергает критике популярную концепцию «интеллектуального взрыва» — идеи о том, что чистое увеличение вычислительной мощности системы приведет к мгновенному скачку в технологиях. Шолле настаивает на том, что интеллект — это не абстрактная величина, которая растет пропорционально количеству флопсов. Это процесс, который неразрывно связан с конкретной средой и историко-цивилизационным контекстом.

Интеллект ограничен тем, какие задачи ставит среда и какими инструментами обладает агент. Даже если мы обеспечим системе колоссальные вычислительные ресурсы, это не создаст «сверхразум», если у системы нет способности к эффективной генерализации и созданию мощных абстракций. Ранее в разговоре они касались природы глубокого обучения и того, что оно отлично справляется с интерполяцией на данных, но пасует перед дискретными задачами, требующими принципиально иных подходов.

Прогресс в создании ИИ — это не гонка мощностей, а поиск способов правильной «внешней» организации знаний и способности системы трансцендировать свой собственный процесс мышления. Интеллектуальный рост — это эволюция методов работы с информацией, а не просто ускорение работы мозга.