Франсуа Шаард: «Рекурсия — это способ заставить 7-млн модель думать лучше, чем GPT-4»

Y Combinator 10 тыс. 37 мин 4 мин 01.05.2026
Главное

В новом эпизоде сериала «Decoded» от Y Combinator приглашенный партнер Франсуа Шаард и ведущий обсуждают фундаментальный сдвиг в архитектуре нейросетей — возвращение к рекурсии. В 2025 году две научные работы (HRM и TRM) показали, что модели объемом всего 7–27 млн параметров могут превосходить гигантов уровня GPT-4 в задачах на логику и рассуждения, если заменить простое увеличение весов на итеративную обработку данных в скрытом пространстве.

🧠 Крах RNN и триумф трансформеров: исторический контекст 0:00

Доминирование трансформеров в современной индустрии ИИ не означает, что это единственно верный путь к сильному искусственному интеллекту (AGI). Франсуа Шаард напоминает, что еще 10 лет назад, в эпоху расцвета архитектур LSTM и RNN (рекуррентных нейронных сетей), исследователь Алекс Грейвс продвигал идею адаптивного времени вычислений . Однако рекуррентные модели столкнулись с непреодолимым барьером — проблемой обратного распространения ошибки во времени (Backpropagation Through Time, BPTT).

🧩 Почему LLM не умеют сортировать списки: лимиты вычислений 4:10

По мнению Франсуа Шаарда, «способность к рассуждению» у современных LLM — это во многом иллюзия, ограниченная архитектурой. В качестве примера он приводит задачу сортировки списка .

Франсуа утверждает, что такие задачи, как судоку, лабиринты или расчет скользящей суммы, являются «несжимаемыми» проблемами . Их нельзя решить «в один присест», не имея возможности возвращаться к промежуточным результатам (рекурсии) внутри самой модели, а не через генерацию текста.

🏗️ Hierarchical Reasoning Models (HRM): биологическое вдохновение 7:32

Статья об иерархических моделях рассуждения (HRM) вернула интерес к рекурсии, предложив структуру, вдохновленную работой мозга. Исследователи заметили, что разные области мозга работают на разных частотах: низкоуровневые — на высоких, высокоуровневые — на низких .

Архитектура HRM включает три уровня рекурсии :

  1. Низкоуровневый модуль (L-net): Быстрые итерации для обработки деталей.
  2. Высокоуровневый модуль (H-net): Более медленные циклы, координирующие общую стратегию.
  3. Внешний цикл уточнения (Outer refinement loop): Повторение всего процесса несколько раз для оттачивания ответа.

Главным достижением HRM стала победа на ARC Prize — тесте на абстрактное мышление, где нейросеть всего на 27 млн параметров обошла модели, которые в тысячи раз больше . При этом HRM обучалась с нуля всего на 1000 задач, без терабайтов предтренировочного текста.

🛠️ Магия DEQ: как обойти проблему памяти 11:18

Чтобы HRM не «умерла» от нехватки памяти при обратном распространении ошибки, авторы использовали трюк из области Deep Equilibrium (DEQ) моделей .

Вместо того чтобы разворачивать все шаги рекурсии и считать градиент через них всех, HRM делает «остановку градиента» (stop-grad). Модель тренируется на «мини-батчах из состояний памяти» . Она берет одно и то же входное значение $X$, но прогоняет его через разные состояния скрытой памяти (carry), накопленные в процессе итераций. Это позволяет обучать глубокую логику без гигантских вычислительных затрат, характерных для старых RNN.

📉 Tiny Recursive Models (TRM): меньше — значит лучше 21:48

Вторая работа, TRM (Tiny Recursive Models), пошла еще дальше, упростив архитектуру HRM. Алексия (автор TRM) доказала, что многие сложности HRM избыточны .

Франсуа сравнивает процесс обучения TRM с алгоритмом ожидания-максимизации (Expectation-Maximization) . В случае с судоку модель не угадывает все цифры сразу. Она использует скрытую память $Z_L$ как «черновик», где пробует варианты, и только когда уверена, фиксирует результат в переменной $Z_H$ . По сути, модель сама открывает алгоритм решения задачи без подсказок человека.

🚀 Будущее: Рекурсия как новый закон масштабирования 34:36

Главный вывод дискуссии: рекурсия — это способ получить «глубину вычислений» без наращивания «глубины параметров» .

По словам Франсуа, современные лаборатории ИИ (OpenAI, Google) уже начинают внедрять эти идеи. Настоящий прорыв случится, когда мощь гигантских трансформеров (умеющих строить отличные семантические представления) объединят с рекурсивными блоками «внутреннего рассуждения» .

Шаард считает, что следующим этапом станет создание универсальных агентов, которые используют рекурсивные модули для решения задач, требующих сотен шагов логики, но при этом остаются компактными и быстрыми .

💬 Цитаты

«Модель HRM на 27 миллионов параметров может обойти модели, обученные на всем интернете, просто за счет эффективной рекурсии.»

Франсуа Шаард 09:59

«Цепочка рассуждений (CoT) — это хак, который ограничен пределами человеческих знаний.»

Франсуа Шаард 19:49

«Если у вас список из 31 элемента, а у трансформера 30 слоев, он физически не может отсортировать его за один проход.»

Франсуа Шаард 05:04
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
BPTT (Backpropagation Through Time)
Метод обучения рекуррентных сетей, требующий развертывания всех шагов во времени, что потребляет огромный объем памяти.
ARC Prize
Тест на абстрактное мышление (Abstraction and Reasoning Corpus), созданный Франсуа Шолле.
Chain of Thought (CoT)
Метод, при котором модель ИИ записывает свои промежуточные рассуждения текстом перед выдачей финального ответа.
Latent Space
Многомерное векторное пространство, внутри которого нейросеть оперирует абстрактными представлениями данных.
Fixed point iteration
Математический процесс нахождения стабильного состояния, используемый в HRM для стабилизации скрытой памяти.
📊 Цифры
🗓 Хронология
  1. 2016 Период пикового использования RNN и ключевой доклад Алекса Грейвса на NIPS.
  2. 2023 Появление HRM (Hierarchical Reasoning Models) и прорыв на ARC Prize.
  3. 2025 Публикация работ по TRM (Tiny Recursive Models) и HRM, зафиксировавших преимущество рекурсии.
  4. Будущее Ожидаемое слияние гигантских LLM и компактных рекурсивных модулей рассуждения.
⚖️ Другая сторона
Искусственный интеллект ARC Prize Hierarchical Reasoning Models Tiny Recursive Models Francois Shaard Y Combinator