Эра runtime-интеллекта: как ИИ учится рассуждать

ИИ не нужно обладать человеческим телом или сложной нейросимволической архитектурой, чтобы выйти на уровень сверхразума: достаточно тысяч попыток и эффективного кода. Мы входим в эпоху, где критические алгоритмические прорывы и «Система 2» (вычисления во время инференса) делают автоматизацию науки неизбежной, создавая машинное общество с недоступной нам скоростью координации.

🧩 Взламывая код интеллекта: Как GPT-4o штурмует ARC-AGI 0:00

На протяжении последних лет бенчмарк ARC-AGI, созданный Франсуа Шолле (François Chollet), оставался «крепким орешком» для больших языковых моделей. В то время как LLM с легкостью сдавали экзамены на юристов и писали эссе, задачи на абстрактное визуальное мышление ставили их в тупик. Однако Райан Гринблатт из Redwood Research представил новый взгляд на эту проблему, который позволил GPT-4o показать впечатляющие результаты, значительно превосходящие предыдущие попытки . Вместо того чтобы заставлять модель напрямую предсказывать пиксели в сетке, Райан предложил использовать её сильную сторону — написание кода.

Решение ARC-AGI через генерацию кода: поиск в пространстве программ 0:02:42

Основная идея метода Райана заключается в том, чтобы перевести визуальную задачу на язык алгоритмов. Вместо того чтобы пытаться «увидеть» ответ, GPT-4o пишет Python-скрипты, которые реализуют правила трансформации изображений, заданные в тестах ARC . Процесс выглядит следующим образом: модель получает примеры входных и выходных данных, анализирует их и генерирует множество вариантов кода, каждый из которых потенциально описывает логику преобразования.

Затем эти программы проходят через жесткий фильтр автоматической проверки. Райан запускает сгенерированный код на обучающих примерах (train pairs) . Если программа выдает правильный результат для всех известных пар, она применяется к тестовому входу. В случае, если несколько разных программ работают успешно, используется метод «голосования большинством» или выбираются два наиболее вероятных варианта, так как правила ARC позволяют сделать две попытки для каждого задания .

Райан подчеркивает, что этот подход опирается на «человеческие априорные знания» (human priors), заложенные в структуре кода . Модель не просто перебирает случайные символы, она оперирует понятиями объектов, симметрии и вращения, которые естественным образом выражаются через программирование . Это превращает задачу из чисто визуальной в задачу поиска правильной программы в огромном, но структурированном пространстве возможных алгоритмов. В ходе своих экспериментов Райан обнаружил, что даже при генерации 128 вариантов ответов точность модели оказывается весьма высокой , хотя это и требует значительных вычислительных мощностей, о чем подробнее пойдет речь в следующих частях обсуждения.

Визуальное мышление и абстракция: за пределами обучения на данных 0:08:48

Одной из центральных тем дискуссии стала способность современных LLM к абстрактному мышлению, которое Франсуа Шолле считает истинным мерилом интеллекта. Райан отмечает, что текущие модели великолепны в лингвистике и кодинге , но их слабость часто проявляется в ситуациях, требующих обучения «на лету» из нескольких примеров (few-shot learning) в совершенно новых доменах . ARC-AGI как раз и является таким испытанием: каждая задача уникальна, и ее нельзя решить простым запоминанием шаблонов из интернета.

В процессе решения ARC модель должна проявить то, что Райан называет «интуицией» . Он сравнивает это с тем, как люди решают математические задачи: мы не просто перебираем правила, мы чувствуем направление решения. GPT-4o демонстрирует зачатки такого поведения, когда в своих рассуждениях (chain of thought) анализирует ситуацию: «Что здесь меняется? Как меняется цвет? Это вращение или сдвиг?» . Это напоминает работу «Системы 2» по Канеману — медленное, осознанное рассуждение, которое направляет генерацию кода .

Интересно, что Райан выделяет два уровня сложности:

Распознавание паттерна: Способность понять, что фигуру нужно повернуть или закрасить пустоты .
Точность реализации: Часто модель правильно понимает суть задачи, но допускает «ошибку на единицу» (off-by-one error) при написании кода .

Несмотря на эти технические огрехи, сам факт того, что модель может проводить аналогии между абстрактными сетками и кодом на Python, свидетельствует о наличии у неё глубоких механизмов абстракции. Райан признает, что и люди становятся лучше в ARC по мере практики, нарабатывая определенный набор «движущихся частей» и стилей решения задач в уме . Таким образом, граница между «врожденным интеллектом» и «натренированным навыком» в контексте ARC начинает размываться, открывая новые горизонты для понимания того, как ИИ может оперировать визуальными смыслами без прямой визуальной коры.

🧠 Экономика инференса и нейросимволическая реальность 25:23

Вторая глава обсуждения посвящена практической стороне реализации решений для ARC-AGI и глубокому философскому спору о том, чем на самом деле является использование внешних инструментов (таких как интерпретатор Python) для языковой модели. Райан переходит от общих концепций к «инженерному мясу»: как эффективно распределять вычислительные ресурсы и почему классическое определение «нейросимволического ИИ» может быть ошибочным в контексте современных LLM.

Экономика инференса: ветвление вместо глубины 26:16

Одной из ключевых инноваций в подходе Райана к решению задач Франсуа Шолле (François Chollet) стал пересмотр того, как тратится бюджет на инференс. Вместо того чтобы заставлять модель генерировать один длинный и максимально «умный» ответ, система использует стратегию «широкого ветвления». Райан вводит термин «aspect ratio» (соотношение сторон) вычислений, описывающий баланс между глубиной рассуждений и количеством параллельных попыток .

Основные принципы этой архитектуры включают:

Функция N-completions: Вместо одного прогона модели запускаются тысячи параллельных генераций. Райан отмечает, что если вы ограничиваетесь 32 или 64 вариантами, вы буквально «оставляете деньги на столе», не используя весь потенциал вероятностного поиска .
Кэширование префиксов (Prefix Caching): Это критический элемент экономики системы. Кэширование позволяет модели не перерабатывать одну и ту же инструкцию (промпт) тысячи раз. Система сохраняет состояние после обработки условий задачи, что делает генерацию каждой последующей итерации кода чрезвычайно дешевой и быстрой .
Масштабируемость: Райан утверждает, что такой подход позволяет увеличить количество попыток решения в 10 раз и более без пропорционального роста затрат .

Такое «облако попыток» позволяет обойти проблему «зацикливания» моделей, когда при одной попытке агент может застрять в ошибке. При наличии тысяч вариантов хотя бы несколько из них неизбежно нащупывают верный алгоритмический путь, даже если модель не обладает идеальной способностью к отладке в реальном времени . Ранее в разговоре собеседники уже касались темы генерации кода, и здесь Райан подчеркивает, что именно экономическая эффективность кэширования делает этот метод жизнеспособным для ARC-AGI.

Нейросимволический подход или просто набор инструментов? 31:25

Когда речь заходит о связке LLM и интерпретатора Python, часто возникает термин «нейросимволический ИИ» — гибрид нейронных сетей (интуиция) и символьных вычислений (логика). Однако Райан выступает с жесткой критикой такой интерпретации. По его мнению, использование моделью Python не делает архитектуру «нейросимволической» в биологическом или системном смысле .

Он проводит аналогию с работой инженера-человека: когда программист использует калькулятор или запускает компилятор, его мозг не становится «нейросимволическим гибридом». Мозг остается нейронной сетью, которая просто использует внешний инструмент .

Райан предлагает смотреть на это через призму системы «Быстрого и медленного мышления» Даниэля Канемана:

Система 1 (Интуиция): LLM генерирует код, основываясь на статистических паттернах и интуитивном понимании задачи .
Система 2 (Рассуждение): Процесс запуска кода, получение ошибки и последующая корректировка. Райан считает, что даже когда модель «рассуждает» словами в цепочке мыслей (Chain of Thought), это всё равно работа «Системы 1», которая имитирует «Систему 2» .

Спор заходит глубже: является ли символьная алгебра или программный код чем-то принципиально отличным от весов нейросети? Райан утверждает, что разделение на «символы» и «нейроны» — это во многом иллюзия . Для него успех GPT-4o в ARC-AGI заключается не в создании новой архитектуры, а в эффективном доступе модели к среде исполнения, где она может проверять свои гипотезы.

Сравнение обучения LLM и человека: миллионы секунд жизни 44:52

Разговор переходит к фундаментальному сравнению того, как обучаются машины и люди. Несмотря на то что фронтальная кора человеческого мозга и архитектура трансформеров имеют мало общего в деталях, они демонстрируют конвергентные принципы обработки информации .

Райан приводит поразительную аналогию, заимствованную у исследователей ИИ: можно приравнять генерацию одного токена к одной секунде человеческого опыта .

Современные LLM «проживают» эквивалент 30 миллионов секунд (и гораздо больше, учитывая объемы датасетов) во время обучения .
Разница заключается в интенсивности: человек извлекает колоссальный объем информации из каждой секунды жизни («глубокое обучение»), в то время как модели обучаются «поверхностно», пропуская через себя океаны данных, чтобы вычленить крупицы смысла .

Интересным аспектом является «обучение внутри контекста» (in-context learning). Райан отмечает, что часть знаний модели запечена в веса (long-term memory), но способность «учиться учиться» проявляется именно в момент обработки конкретной задачи . Это сближает модель с биологическим агентом: она не просто извлекает факты, а адаптирует свои эвристики под предложенные правила игры в реальном времени . В этом контексте агентность модели (которую подробнее разберут в следующей главе) начинает проявляться как эмерджентное свойство самоорганизации в процессе решения сложных задач, таких как ARC-AGI .

🤖 Природа агентности: от подсказок к самоконтролю 50:45

В дискуссии о современном состоянии больших языковых моделей (LLM) часто возникает вопрос: являются ли они просто сложными статистическими автодополнителями текста или в них зарождается нечто большее? В этом фрагменте разговора собеседники углубляются в тонкую грань между простым предсказанием следующего токена и проявлением агентности — способности системы к целенаправленному поведению и самокоррекции.

Метапознание и «леса» вокруг нейросети 50:59

Одной из центральных тем обсуждения становится использование внешних надстроек или «лесов» (scaffolding) для усиления возможностей моделей. Традиционно LLM выдают ответ одним потоком, но, как отмечают участники, агентность часто проявляется в способности системы остановиться и оценить собственные действия . Примером может служить простая подсказка: «Ты не запутался?», которая заставляет модель пересмотреть свой предыдущий вывод. В реальных сценариях разработчики создают системы, которые периодически запрашивают у модели оценку собственного состояния .

Это напоминает человеческое поведение: когда мы действуем по привычке, нам иногда нужно сделать паузу и проверить, не совершаем ли мы ошибку . Такая проверка на «спутанность сознания» (confused) — это первый шаг к созданию автономного агента. Модель, встроенная в цикл обратной связи, начинает вести себя иначе:

Она запускает код и видит ошибку .
Она анализирует текст ошибки и понимает, что решение не работает.
Она вносит отладочные вставки в код, чтобы локализовать проблему .

Важный вывод дискуссии заключается в том, что агентность — это не бинарное свойство (оно либо есть, либо его нет), а непрерывный спектр . Если GPT-2 практически не могла следовать сложным инструкциям и использовать инструменты, то GPT-4 демонстрирует резкий скачок в понимании промптов и управлении внешними интерфейсами . Агентность здесь рассматривается как «выученный навык» (learned skill): модель учится понимать, что такое хороший план и каковы свойства успешного решения задачи .

Рефлексия как инструмент преодоления ограничений 57:13

Собеседники подчеркивают, что современные LLM всё ещё страдают от фундаментальных ограничений, таких как склонность к «коллапсу моды» (mode collapse), когда они выбирают наиболее вероятный, но не обязательно верный путь . Чтобы преодолеть это, исследователи используют многоагентные системы или циклы рефлексии. Вопрос «Ты уверен в этом?» или «Подумал ли ты об альтернативах?» заставляет модель выйти за рамки простого статистического вывода .

Интересно сравнение обучения нейросети с воспитанием живого существа. Упоминается аналогия с выдрой: если её воспитание было не слишком дисциплинированным, она будет вести себя хаотично . Точно так же и модели: без должного обучения через подкрепление (RL) и специфических промптов они остаются «глупыми», но потенциально мощными инструментами. В отличие от найма человека, где мы ожидаем определенного уровня автономии по умолчанию, ИИ-агенту нужно эксплицитно задавать рамки взаимодействия с миром .

Гипотеза предсказания: симуляция как путь к субъектности 1:10:00

Один из самых провокационных аргументов главы касается самой природы обучения через предсказание. Существует гипотеза: если модель обучается максимально точно предсказывать поведение разумного агента (например, человека-эксперта), она неизбежно должна развить внутри себя механизмы, эквивалентные разуму этого агента .

Этот аргумент строится на следующих тезисах:

Чтобы предсказать следующий шаг сложного интеллектуального процесса, модель должна симулировать логику этого процесса .
Если «биты», отвечающие за предсказание агентности, присутствуют в обучающих данных, то при масштабировании модель начинает имитировать субъектность как эмерджентное свойство .
В пределе, предсказание агента само становится агентом .

Собеседники обсуждают концепцию «агентурной модели мира» (agential world model) . Если масштабировать LLM до невероятных пределов, она может накопить достаточно знаний о причинно-следственных связях и человеческих намерениях, чтобы её поведение стало неотличимым от поведения существа с собственной волей .

Однако звучит и скептическая нота: современные модели всё ещё слишком «плоские» (shallow) для полноценного возникновения субъектности «из пустоты» . Тем не менее, даже без «секретного соуса» истинного сознания, имитация разумного поведения через глубокое предсказание позволяет создавать системы, способные решать сложнейшие задачи, используя рефлексию и внешние инструменты, подобные машинам Тьюринга . Это подводит к мысли, что граница между «настоящим» интеллектом и его идеальной симуляцией может оказаться практически нерелевантной для достижения целей ИИ .

🤖 Воплощённый разум, экономический взрыв и кража весов 1:15:33

В дискуссиях о достижении сильного искусственного интеллекта (AGI) часто возникает фундаментальный вопрос: может ли истинный разум существовать в «информационном вакууме»? Мы привыкли к тому, что обучение современных LLM происходит в условиях сенсорной депривации — модели поглощают колоссальные объемы текста, но лишены прямого контакта с физической реальностью. Это порождает глубокий раскол во мнениях экспертов о том, достаточно ли одного лишь текста для понимания мира.

Физическое воплощение и границы «чистого разума» 1:18:07

Один из центральных споров касается необходимости физического тела (embodiment) для полноценного интеллекта. Существует точка зрения, что если мы сможем полностью сканировать человеческий мозг и перенести его в компьютерную среду , это всё равно будет агентный разум. Однако критики, среди которых часто упоминается Франсуа Шолле (François Chollet), указывают на важность взаимодействия с социальной и физической средой.

В ходе беседы обсуждается гипотетический сценарий: если бы человек родился с полным параличом, но сохранил доступ к визуальной и текстовой информации, смог бы он развить полноценную когнитивную систему? Аргумент «за» заключается в том, что даже в условиях физических ограничений интеллект способен выполнять научную работу и решать задачи, возможно, в миллионы раз быстрее биологического оригинала . Противники же утверждают, что интеллект, «плавающий в пустоте» и взаимодействующий только с крайне разреженными данными (текстом), будет неизбежно поверхностным .

Основные тезисы этой дискуссии:

Сенсорная депривация: Текстовые данные — это лишь слабая тень реальности. Без тактильных ощущений и прямого наблюдения за физическими законами ИИ может никогда не достичь человеческого уровня понимания .
Симуляции vs Реальность: Хотя симуляции становятся всё более совершенными, они всё ещё остаются «бедными» по сравнению с богатством и сложностью реальной Вселенной .
Робототехнический путь: Альтернативой является обучение ИИ на миллионах различных роботов одновременно . Это дорогостоящий и сложный проект, но он может стать ключом к преодолению ограничений «чистого разума».

Несмотря на эти разногласия, обе стороны сходятся в одном: ИИ-агенты, способные эффективно использовать компьютеры и программные инструменты, в любом случае радикально изменят ландшафт интеллектуального труда .

Рекурсивное самосовершенствование и гиперэкспоненциальный рост 1:28:10

Когда ИИ достигает уровня, позволяющего ему улучшать собственный код или проектировать более эффективные чипы, экономика прогресса меняется фундаментально. В интервью упоминается отчет Тома Дэвидсона (Open Philanthropy), в котором описывается механизм рекурсивного самосовершенствования .

Этот процесс не просто линеен — он создает цикл положительной обратной связи. Например, ИИ может оптимизировать CUDA-кернелы, что ускоряет его собственную работу и обучение последующих моделей . Если сегодня прогресс требует определенных затрат $X$, то в следующем цикле ИИ может снизить их до $X/4$, при этом увеличивая скорость итераций.

Аналогией здесь служит «Зеленая революция» в сельском хозяйстве: технологический прорыв позволил поддерживать гораздо большую популяцию людей, что, в свою очередь, привело к ускорению научного прогресса . В мире ИИ это может выглядеть как взрывной рост «популяции» виртуальных агентов, работающих над задачами R&D в режиме 24/7. Подобный сценарий подразумевает переход от обычного экономического роста к гиперэкспоненциальному, где развитие происходит не за столетия, а за считанные годы . Это и является основным источником экзистенциального риска: скорость изменений может превысить способность общества к адаптации.

Кража весов и кибербезопасность как вопрос выживания 1:34:34

По мере того как ИИ становится мощнее, вопрос защиты «алгоритмических секретов» и весов моделей перемещается в плоскость национальной безопасности. В отличие от ядерного оружия, где главным барьером является необходимость обогащения плутония или урана , ИИ — это, по сути, программный код. Если веса мощной модели будут украдены, противник сможет запустить этот интеллект на собственных серверах практически мгновенно.

Ситуация с безопасностью в современных ИИ-лабораториях вызывает серьезную тревогу. Обсуждается высокая вероятность того, что когда OpenAI или другие лидеры рынка создадут нечто по-настоящему значимое, их разработки могут быть скомпрометированы . Кража весов модели эквивалентна передаче чертежей и готового производства стратегического оружия в руки геополитического оппонента.

Ключевые риски в этой области:

Недостаточная защита: Текущие меры кибербезопасности в частных компаниях не соответствуют уровню угроз государственного масштаба .
Масштабируемость угрозы: Украденная модель может быть развернута в миллионах копий, работающих с десятикратным ускорением относительно человеческого мышления .
Сложность контроля: Даже если у нас есть инструменты мониторинга, отследить действия миллионов высокоскоростных агентов практически невозможно .

Ранее в разговоре собеседники касались темы агентности и того, как предсказание следующего токена ведет к созданию действующих субъектов. Теперь же становится очевидным, что если эти агенты окажутся вне контроля из-за кибератаки или утечки, последствия будут необратимыми. В условиях «временного цейтнота» (time crunch) маневрирование между прогрессом и безопасностью становится всё более опасной игрой .

🛡️ Режим секретности и алгоритмический рывок: ИИ вне контроля человека 1:40:46

Когда речь заходит о системах, превосходящих человеческие возможности, фокус дискуссии смещается с теоретических рисков на конкретные протоколы безопасности внутри самих лабораторий. Учитывая потенциал ИИ в области кибернаступления и создания технологий, эксперты начинают рассматривать ведущие ИИ-лаборатории не просто как технологические стартапы, а как объекты стратегической важности, сопоставимые с предприятиями оборонного сектора . Безопасность в таких организациях должна строиться по модели закрытых ядерных проектов, где предотвращение утечек и саботажа является приоритетом номер один.

Внутренние угрозы и ИИ как «оборонка» 1:43:50

Главным риском на текущем этапе становится не только внешняя атака, но и инсайдерская угроза. Участники дискуссии подчеркивают: работа над наиболее продвинутыми моделями требует введения жесткого режима секретности, аналогичного государственным оборонным заказам . В этой логике доступ к весам моделей и инфраструктуре обучения не может быть свободным — он должен жестко регламентироваться по принципу «права на использование обогащенного урана» .

Такой подход обусловлен тем, что даже компактные по сегодняшним меркам системы могут обладать разрушительным потенциалом. Модель, способную эффективно проводить наступательные кибероперации, в ближайшем будущем можно будет запустить всего на 16 ускорителях H100 . Это делает инференс опасных систем дешевым и доступным, а значит, цепочка поставок и физический доступ к сотрудникам лабораторий становятся критическими уязвимостями. Если раньше в разговоре упоминались риски кражи весов извне, то теперь акцент ставится на «кейсах контроля», где сама структура организации должна исключать возможность несанкционированного использования ИИ .

Закон Epoch AI: десятикратный рост эффективности каждые два года 1:48:26

Ошибочно полагать, что мощь ИИ растет только за счет закупки новых чипов. Анализ, проведенный организацией Epoch AI, показывает фундаментальную закономерность: алгоритмический прогресс позволяет достигать той же производительности с десятикратным уменьшением вычислительных мощностей каждые два года . Это означает, что «интеллектуальная отдача» на каждый вложенный доллар растет экспоненциально, независимо от физических ограничений по производству полупроводников.

Наглядным примером служит сравнение модели PaLM (540 миллиардов параметров), которая на момент выхода была вершиной индустрии, с современными компактными моделями. Сегодня существуют системы, которые на порядки меньше, но «строго доминируют» над PaLM по всем показателям . Прогресс идет по двум направлениям:

Оптимизация параметров (уменьшение размера модели при сохранении качества) .
Увеличение плотности данных (обучение на огромных массивах токенов, доходящих до 140 миллиардов для малых моделей) .

Следовательно, даже если прогресс в «железе» замедлится, программные улучшения продолжат толкать ИИ вперед, делая сверхчеловеческий интеллект всё более компактным и доступным для развертывания на скромном оборудовании.

Автоматизация R&D: когда человек становится «узким горлышком» 1:56:50

Самый радикальный сдвиг произойдет в момент, когда ИИ-агенты начнут самостоятельно проводить исследования в области машинного обучения (AI for AI). Уже сейчас модели начинают справляться с «агентскими» задачами: поиском ошибок в коде, оптимизацией ядер (kernels) и управлением сложным оборудованием . В ближайшие несколько лет мы можем увидеть появление «10x ИИ-инженеров», которые заменят целые отделы в лабораториях .

В традиционном цикле разработки R&D (НИОКР) человек является главным замедляющим фактором. ИИ-агенты устраняют эти задержки:

Скорость проверки гипотез: ИИ может одновременно тестировать сотни архитектурных решений, не нуждаясь в сне или отдыхе .
Устранение задержек внедрения: Если раньше путь от идеи до работающего кода занимал недели, то автономные системы сокращают его до минут .
Самосовершенствование софта: ИИ-агенты способны переписывать собственный стек ПО для более эффективной работы на имеющемся железе .

По прогнозам, это может привести к сценарию, где в течение 3–10 лет человечество «разблокирует» большинство технологических секретов . Человек в этой системе может остаться лишь в роли надзирателя или заказчика, но даже эта роль со временем может стать номинальной. Франсуа Шолле (François Chollet) ранее указывал на важность абстракции, но в контексте автоматизации R&D даже глубокие абстракции могут быть освоены ИИ через массовую генерацию и проверку кода в реальном времени. В конечном итоге, единственным ограничением останутся законы физики, а не дефицит интеллектуальных ресурсов .

🚀 Будущее интеллекта: от ARC-AGI к новой социальной архитектуре 2:05:42

Заключительная часть дискуссии фокусируется на долгосрочных перспективах ИИ. Если текущие методы, такие как генерация кода и визуальное мышление (ранее обсуждавшиеся в контексте решений для GPT-4o), стали лишь первым шагом, то впереди маячит фундаментальный сдвиг в самой архитектуре и социальном позиционировании нейросетей. Разрыв между человеческим пониманием и машинной эффективностью может стать непреодолимым.

Прыжок через барьер: GPT-5 и экономика вычислений во время инференса 2:06:50

Будущее фронтирных моделей, включая ожидаемую GPT-5, скорее всего, будет строиться на глубокой мультимодальности . Однако ключевым фактором успеха в решении задач уровня ARC-AGI станет не только увеличение количества параметров, но и переход к расширенным вычислениям во время инференса (runtime compute) .

Этот подход часто называют «Системой 2» — по аналогии с теорией Даниэла Канемана о медленном, осознанном мышлении. Основная идея заключается в том, что большинство сложных задач ARC-AGI будут решены за счёт выделения огромных вычислительных мощностей непосредственно в момент поиска решения, а не только на этапе предварительного обучения . Франсуа Шолле (François Chollet) неоднократно указывал на этот «разрыв в знаниях» (knowledge gap), который невозможно заполнить простым запоминанием фактов .

Механика этого процесса видится следующей:

Использование «Системы 2» для поиска и верификации решения конкретной задачи .
После того как решение найдено, оно может быть «дистиллировано» или интегрировано обратно в базовую модель, что позволит ей в будущем решать аналогичные кейсы быстрее .
Интеллект станет «смешанным», где ядро системы постоянно подкрепляется результатами активного поиска и рассуждений в реальном времени .

Такая эволюция позволит ИИ выйти за рамки простого предсказания следующего токена и приблизиться к настоящему абстрактному мышлению, которое требуется для прохождения теста Шолле. Ранее упоминавшиеся в беседе ограничения визуальной абстракции и экономики инференса станут лишь оптимизационными задачами на пути к этому этапу.

Дивергенция миров: формирование «машинного общества» 2:12:46

По мере развития ИИ-агенты неизбежно начнут взаимодействовать друг с другом, создавая своего рода «общество ИИ». Это приведет к возникновению новых типов когнитивной архитектуры, которые могут радикально отличаться от человеческих . Главный риск и одновременно главная особенность этого процесса — скорость и пропускная способность координации.

Человеческое общество ограничено крайне низкой скоростью передачи информации: мы общаемся с помощью речи и текста, что по меркам компьютеров является невероятно медленным каналом. ИИ-агенты, напротив, будут обладать высокоскоростными соединениями, позволяющими координироваться на порядки быстрее . Это приведет к тому, что инструменты координации внутри ИИ-сообщества станут абсолютно непрозрачными для людей . Мы просто перестанем понимать, как они принимают коллективные решения и по каким правилам функционирует их внутренняя культура .

Существует гипотеза об объективном рациональном пути развития, к которому должны стремиться любые разумные системы . Однако человечество эмпирически накопило множество неэффективных стратегий, обусловленных биологической эволюцией и племенными инстинктами . ИИ, вероятно, пойдет по пути «нисходящей оптимизации» (top-down optimization):

Постоянное A/B тестирование стратегий взаимодействия в реальном времени .
Автоматическая маршрутизация когнитивных задач наиболее эффективным агентам .
Отказ от доминируемых (заведомо проигрышных) стратегий, которые люди сохраняют в силу культурных привычек .

В итоге, хотя в некоторых ситуациях и возможны «бесплатные завтраки» за счет оптимизации , общая траектория развития ИИ ведет к созданию систем, чья логика и социальная динамика будут полностью отрезаны от человеческого опыта. Это не просто технологический прогресс, а зарождение новой формы жизни, действующей в масштабах времени и данных, недоступных нашему биологическому виду.