В индустрии искусственного интеллекта наметился тектонический сдвиг: от стратегии постепенного улучшения продуктов компании переходят к концепции «прямого пути» к сверхразуму. Логан Килпатрик, один из руководителей направления Google AI, публично поддержал видение Ильи Суцкевера, заявив, что достижение искусственного супер интеллекта (ASI) без промежуточных этапов становится всё более вероятным сценарием.
🚀 Концепция «Straight Shot»: почему Илья Суцкевер поставил всё на одну карту 0:00
Логан Килпатрик, отвечающий в Google за AI Studio и API Gemini, прокомментировал стратегию нового стартапа Ильи Суцкевера — Safe Superintelligence (SSI) . По словам Килпатрика, идея Суцкевера о «прямом выстреле» (straight shot) в сторону ASI без выпуска промежуточных моделей и продуктов изначально казалась многим экспертам маловероятной . Традиционный подход подразумевает итерации: запуск моделей, сбор отзывов, создание «рва» (moat) вокруг продукта.
Однако сейчас Килпатрик признаёт:
- Подход SSI, ориентированный на одну цель — безопасный сверхразум, выглядит всё более оправданным .
- Успех масштабирования вычислительных мощностей во время логического вывода (test-time compute) указывает на то, что прямой путь к масштабированию может сработать .
- По мнению представителя Google, достижение AGI (общего ИИ) не будет разовым «взрывом» в истории, а скорее будет похоже на серию быстрых релизов продуктов, что, как считает Килпатрик, является лучшим исходом для человечества .
В этом прогнозе Килпатрик не одинок. Сэм Олтмен (OpenAI) в своём «Сентябрьском манифесте» (статья The Intelligence Age) также предположил, что сверхразум может появиться через «несколько тысяч дней» .
🧠 Технологический фундамент: от Strawberry до «тихого рассуждения» 3:20
То, что раньше было лишь слухами о проектах Q* (Q-Star) и Strawberry, сегодня обретает форму в моделях серии OpenAI o1 и o3 . Ведущий Уэс Рот отмечает, что прогресс в области ИИ часто опирается на научные работы, опубликованные за 12–18 месяцев до коммерческого взрыва .
Ключевой вехой стала работа исследователей из Стэнфорда и Google Research 2022 года под названием «STaR: Self-Taught Reasoner» . Суть метода «самообучающегося мыслителя»:
- Бутстрапинг рассуждений: Модель генерирует обоснование (rationale) для своего ответа. Если ответ верный, это рассуждение добавляется в обучающий датасет для следующей итерации .
- Синтетические данные: Система сама создает данные для своего обучения, фактически «вытягивая себя за волосы» на новый уровень интеллекта .
- Аналогия с AlphaGo: Как и ИИ для игры в го, который стал непобедимым, играя против самого себя миллионы раз, языковые модели начинают превосходить человеческий уровень через самообучение .
В марте 2024 года вышла новая работа — «Quiet-STaR», где предлагается концепция, при которой ИИ «думает перед тем, как говорить» . Это именно то, что реализовано в модели OpenAI o1: разделение процесса «скрытых мыслей» и финального ответа .
⚙️ Test-Time Compute: новый закон масштабирования 10:40
Уэс Рот объясняет, что именно увидел Илья Суцкевер перед своим уходом из OpenAI (во время событий с кратковременным увольнением Сэма Олтмена). Речь идёт о переходе от масштабирования обучения к масштабированию времени проверки (test-time compute) .
Основные различия:
- Традиционный скейлинг: Добавление большего количества GPU и данных во время обучения модели. Это повышает общую «эрудицию» ИИ .
- Test-Time Compute: Выделение огромных вычислительных ресурсов в тот момент, когда пользователь уже задал вопрос. Модель тратит секунды или минуты на перебор вариантов и самопроверку .
На графиках математических соревнований (AIME) видно, что точность модели o1 стремительно растёт при увеличении времени на размышление . Это создаёт новую парадигму развития, где прогресс больше не ограничен только объёмом интернета, на котором можно учиться.
📊 Прыжок через ARC-AGI: модель o3 и «вертикальный» прогресс 13:26
Одним из самых сложных тестов для ИИ считался ARC-AGI (тест Франсуа Шолле на способность к адаптации и обучению новым концепциям). Человеческий базовый уровень в нём составляет около 85% .
История прогресса в ARC-AGI:
- GPT-4 и GPT-4o показывали крайне низкие результаты — в районе 5–7% .
- Модель o1-preview совершила скачок до 20–30% .
- Новейшая модель o3 набрала 88% при использовании неограниченных вычислительных ресурсов .
Уэс Рот подчеркивает, что график прогресса превратился в почти вертикальную линию . Если раньше ИИ был в 10 раз слабее человека в этих задачах, то за несколько месяцев он превзошел среднестатистического взрослого. По некоторым оценкам, запуск o3 в режиме максимальной мощности мог стоить около $300 000 на один прогон теста .
🏁 Уровни AGI: где мы находимся по версии Google DeepMind 19:48
Для понимания того, насколько близок ASI, ведущий обращается к классификации уровней AGI от Google DeepMind .
Классификация включает два направления:
- Узкий ИИ (Narrow): Суперкомпьютерные способности в одной области (например, AlphaFold для белков или Stockfish для шахмат) .
- Общий ИИ (General): Способность решать широкий спектр задач.
Уровни общего ИИ:
- Уровень 1 (Emerging): ChatGPT, Bard (уже достигнут) .
- Уровень 2 (Competent): Уровень 50% квалифицированных взрослых.
- Уровень 3 (Expert): Уровень 90% квалифицированных взрослых.
- Уровень 4 (Virtuoso): Уровень 99% квалифицированных взрослых.
- Уровень 5 (ASI): Превосходит всех людей во всём.
Уэс Рот высказывает мнение, что с появлением моделей o1 и o3 человечество уже входит в категории «компетентного» или даже «экспертного» AGI . Он аргументирует это тем, что даже если остановить прогресс самих моделей прямо сейчас, создание правильной «оснастки» (scaffolding) и AI-агентов позволит этим моделям выполнять работу на уровне экспертов в большинстве цифровых профессий .
В завершение Рот задаёт вопрос: если график «вертикального» роста способностей при масштабировании времени на размышление сохранится, не окажемся ли мы у порога ASI гораздо быстрее, чем предсказывали самые смелые прогнозы?