Эйсо Кант: «Вы не сможете дообучить свой путь к AGI»

Machine Learning Street Talk 33,7 тыс. 1 ч 36 мин 5 мин 02.04.2025
Главное

Эйсо Кант (Eiso Kant), сооснователь и технический директор стартапа Poolside AI, стал гостем подкаста Machine Learning Street Talk, чтобы обсудить будущее искусственного интеллекта и подходы к его обучению. В интервью эксперт подробно объясняет, почему простая масштабируемость существующих языковых моделей и их дообучение (fine-tuning) не приведут человечество к созданию сильного ИИ (AGI). По мнению спикера, ключом к новому технологическому прорыву является обучение с подкреплением на основе реальной обратной связи от исполнения программного кода.

🚀 Путь к AGI и философия создания Poolside 0:00

Эйсо Кант отмечает, что индустрия долгое время находилась под влиянием нарратива о линейном масштабировании языковых моделей. Большинство исследовательских лабораторий верили, что увеличение архитектуры GPT в 10 раз и насыщение её веб-данными автоматически приведёт к моменту создания AGI. Однако команда Poolside изначально не разделяла эту позицию, видя необходимость принципиально нового вектора развития. По прогнозам Канта, появление ИИ человеческого уровня во многих сферах интеллектуального труда произойдет уже в ближайшие 18–36 месяцев.

Истоки компании и трёхэтапный план

История партнёрства основателей Poolside началась задолго до официального старта проекта. Эйсо Кант начал программировать в раннем возрасте и в 2016 году основал компанию Source{d} — стартап, сфокусированный на генерации кода нейросетями. В 2017 году Джейсон (Jason), занимавший тогда пост технического директора GitHub, предложил выкупить Source{d}. Кант отклонил предложение о поглощении, однако предприниматели остались близкими друзьями. В апреле 2023 года они объединили усилия для создания Poolside.

С первого дня на сайте компании был зафиксирован трёхэтапный стратегический план:

🧠 Ограничения предсказания токенов и сила обучения с подкреплением (RL) 11:13

Кант полностью поддерживает важность масштабирования вычислительных мощностей и объёмов данных, однако считает, что традиционные подходы упираются в тупик. Масштабирование предсказания следующего токена эквивалентно обучению с подражанием (imitation learning). В то же время обучение с подкреплением (Reinforcement Learning) представляет собой обучение методом проб и ошибок (trial and error). Без внешней детерминированной среды модель, обучающаяся только на синтетических данных, уподобляется змее, пожирающей собственный хвост.

Метод RLCEF как ключевая инновация

Для решения этой проблемы Poolside использует прорывной метод — обучение с подкреплением на основе обратной связи от выполнения кода (Reinforcement Learning from Code Execution Feedback, RLCEF). Компания создала масштабную изолированную экосистему, включающую:

ИИ получает конкретную задачу по модификации кода на определённом коммите, после чего система компилирует или интерпретирует результат. Полученный сигнал от тестов или компилятора позволяет алгоритму точно корректировать траекторию мышления, делая её «более правильной и менее ошибочной». Кант подчёркивает, что среда программирования уникальна: она достаточно детерминирована для получения чёткого вознаграждения, но при этом обладает колоссальным разнообразием задач, что защищает модель от коллапса и переобучения.

🏗️ Архитектурные инновации и экономика вычислений 19:04

Современные базовые модели оперируют в пространствах экстремально высокой размерности. Первая волна масштабирования улучшила репрезентацию наиболее часто встречающихся в интернете вещей — языка и базовых фактов. Однако она не смогла развить скрытые пространства, отвечающие за сложное многошаговое планирование и логические рассуждения. Применение RL позволяет исправить этот дисбаланс.

Эффективность вычислений и новые подходы

По словам технического директора Poolside, всю инженерную работу можно разделить на два ключевых направления: оптимизация эффективности вычислений (обучение и инференс) и улучшение качества данных. В рамках этих задач компания внедрила несколько технологических решений:

  1. Линейное внимание (Linear Attention): Год назад Poolside сделала крупную ставку на RNN-подобное линейное внимание, и модифицированные модели успешно работают в продакшене с осени прошлого года. Это кардинально снижает стоимость инференса.
  2. Диффузионные языковые модели: Появившиеся архитектуры демонстрируют 10-кратное преимущество в эффективности за счёт генерации текста всего за 5-6 диффузионных шагов вместо последовательного посимвольного вывода. Диффузия удобна для редактирования кода «в середине» блока. Тем не менее, Poolside пока не планирует переходить на этот метод из-за собственных закрытых разработок.
  3. Аппаратная кастомизация: Оптимальная архитектура модели всегда диктуется возможностями чипов, а не наоборот. При переходе от графических процессоров серии Hopper к новым системам GBX300, где 72 чипа объединены шиной NVLink, архитектуру приходится полностью перестраивать под специфику межсоединений.

В качестве примера успешной реализации альтернативного подхода Кант приводит китайскую компанию DeepSeek. Коллектив из 200 исследователей, обладая инфраструктурой стоимостью более миллиарда долларов, за 2 года проделал выдающуюся работу, описанную в 47-страничном отчёте по модели V3. Эксперт опровергает слухи о краже данных и заявляет, что успех DeepSeek — это результат чистой инженерной оптимизации.

🏢 Развёртывание ИИ в корпоративной среде и стратегия Go-to-Market 24:59

Выбор фокуса Poolside обусловлен рыночной прагматикой: около 70% всех мировых бюджетов на разработку программного обеспечения тратится внутри крупных корпораций. При этом enterprise-клиенты представляют собой крайне сложные среды с жёсткими протоколами безопасности.

Доставка модели к данным

Главный бизнес-принцип Poolside звучит как «принеси модель к данным, а не данные к модели». Вместо предоставления публичного API компания разворачивает полноценный технологический стек, включая веса моделей и прикладные интерфейсы, непосредственно внутри закрытого контура клиента.

👨‍💻 Трансформация процесса разработки и будущее программирования 50:36

Внедрение ИИ-ассистентов меняет саму структуру труда. В большинстве крупных компаний технологии дают стабильный прирост продуктивности в 20–30%, а на узких задачах вроде автоматизации юнит-тестов эффективность возрастает в 2–4 раза. Роль человека постепенно эволюционирует от написания кода к его ревьюированию и архитектурному надзору.

Судьба жизненного цикла ПО и важность языка

Эйсо Кант уверен, что традиционный жизненный цикл разработки (SDLC) со временем полностью «схлопнется» внутрь нейросетевых моделей. Для критически важных систем (таких как банковская инфраструктура или управление электросетями) строгие внешние проверки и тесты сохранятся, но выполнять их будут автономные ИИ-агенты.

Несмотря на автоматизацию, Кант призывает родителей мотивировать детей учиться программированию:

Спикер также настаивает на критической важности сохранения рассуждений ИИ в текстовом формате на естественном языке, а не в скрытых латентных пространствах. Использование понятных цепочек мыслей (thinking traces) обеспечивает необходимый уровень интерпретируемости, что жизненно важно для сквозного контроля безопасности и выравнивания (alignment) интеллектуальных систем.

💬 Цитаты

«Вы не сможете дообучить свой путь к AGI.»

Эйсо Кант 00:45

«Масштабирование предсказания следующего токена эквивалентно обучению с подражанием. Масштабирование обучения с подкреплением эквивалентно обучению методом проб и ошибок.»

Эйсо Кант 11:51

«Я хочу, чтобы медсестра была человеком, но я хочу, чтобы хирург однажды стал роботом.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
AGI (Artificial General Intelligence)
Искусственный общий интеллект, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
RLCEF (Reinforcement Learning from Code Execution Feedback)
Метод обучения ИИ с подкреплением на основе автоматической обратной связи от реального выполнения сгенерированного кода.
Линейное внимание (Linear Attention)
Архитектурная модификация трансформеров, снижающая вычислительную сложность и стоимость инференса моделей.
VPC (Virtual Private Cloud)
Изолированное виртуальное облако внутри публичного облака для безопасного размещения корпоративных данных и ИИ-моделей.
Диффузионные языковые модели
Альтернативная архитектура нейросетей, генерирующая текст за несколько шагов уточнения вместо посимвольного вывода.
📊 Цифры
🗓 Хронология
  1. 2016 год Эйсо Кант основывает компанию Source{d} для генерации кода с помощью нейросетей.
  2. 2017 год Джейсон, будучи CTO GitHub, делает предложение о покупке Source{d}, положившее начало дружбе основателей.
  3. Апрель 2023 года Эйсо Кант и Джейсон официально основывают стартап Poolside AI.
  4. Осень прошлого года Poolside успешно внедряет модели с линейным вниманием в коммерческую эксплуатацию.
  5. Декабрь Poolside объявляет о стратегическом партнерстве первого уровня с Amazon Web Services.
⚖️ Другая сторона
Искусственный интеллект Poolside AI Эйсо Кант Обучение с подкреплением AWS VPC DeepSeek