Логан Килпатрик из Google: «Прямой путь к сверхразуму (ASI) становится реальностью»

Wes Roth 98,2 тыс. 24 мин 4 мин 30.12.2024
Главное

В индустрии искусственного интеллекта наметился тектонический сдвиг: от стратегии постепенного улучшения продуктов компании переходят к концепции «прямого пути» к сверхразуму. Логан Килпатрик, один из руководителей направления Google AI, публично поддержал видение Ильи Суцкевера, заявив, что достижение искусственного супер интеллекта (ASI) без промежуточных этапов становится всё более вероятным сценарием.

🚀 Концепция «Straight Shot»: почему Илья Суцкевер поставил всё на одну карту 0:00

Логан Килпатрик, отвечающий в Google за AI Studio и API Gemini, прокомментировал стратегию нового стартапа Ильи Суцкевера — Safe Superintelligence (SSI) . По словам Килпатрика, идея Суцкевера о «прямом выстреле» (straight shot) в сторону ASI без выпуска промежуточных моделей и продуктов изначально казалась многим экспертам маловероятной . Традиционный подход подразумевает итерации: запуск моделей, сбор отзывов, создание «рва» (moat) вокруг продукта.

Однако сейчас Килпатрик признаёт:

В этом прогнозе Килпатрик не одинок. Сэм Олтмен (OpenAI) в своём «Сентябрьском манифесте» (статья The Intelligence Age) также предположил, что сверхразум может появиться через «несколько тысяч дней» .

🧠 Технологический фундамент: от Strawberry до «тихого рассуждения» 3:20

То, что раньше было лишь слухами о проектах Q* (Q-Star) и Strawberry, сегодня обретает форму в моделях серии OpenAI o1 и o3 . Ведущий Уэс Рот отмечает, что прогресс в области ИИ часто опирается на научные работы, опубликованные за 12–18 месяцев до коммерческого взрыва .

Ключевой вехой стала работа исследователей из Стэнфорда и Google Research 2022 года под названием «STaR: Self-Taught Reasoner» . Суть метода «самообучающегося мыслителя»:

В марте 2024 года вышла новая работа — «Quiet-STaR», где предлагается концепция, при которой ИИ «думает перед тем, как говорить» . Это именно то, что реализовано в модели OpenAI o1: разделение процесса «скрытых мыслей» и финального ответа .

⚙️ Test-Time Compute: новый закон масштабирования 10:40

Уэс Рот объясняет, что именно увидел Илья Суцкевер перед своим уходом из OpenAI (во время событий с кратковременным увольнением Сэма Олтмена). Речь идёт о переходе от масштабирования обучения к масштабированию времени проверки (test-time compute) .

Основные различия:

  1. Традиционный скейлинг: Добавление большего количества GPU и данных во время обучения модели. Это повышает общую «эрудицию» ИИ .
  2. Test-Time Compute: Выделение огромных вычислительных ресурсов в тот момент, когда пользователь уже задал вопрос. Модель тратит секунды или минуты на перебор вариантов и самопроверку .

На графиках математических соревнований (AIME) видно, что точность модели o1 стремительно растёт при увеличении времени на размышление . Это создаёт новую парадигму развития, где прогресс больше не ограничен только объёмом интернета, на котором можно учиться.

📊 Прыжок через ARC-AGI: модель o3 и «вертикальный» прогресс 13:26

Одним из самых сложных тестов для ИИ считался ARC-AGI (тест Франсуа Шолле на способность к адаптации и обучению новым концепциям). Человеческий базовый уровень в нём составляет около 85% .

История прогресса в ARC-AGI:

Уэс Рот подчеркивает, что график прогресса превратился в почти вертикальную линию . Если раньше ИИ был в 10 раз слабее человека в этих задачах, то за несколько месяцев он превзошел среднестатистического взрослого. По некоторым оценкам, запуск o3 в режиме максимальной мощности мог стоить около $300 000 на один прогон теста .

🏁 Уровни AGI: где мы находимся по версии Google DeepMind 19:48

Для понимания того, насколько близок ASI, ведущий обращается к классификации уровней AGI от Google DeepMind .

Классификация включает два направления:

  1. Узкий ИИ (Narrow): Суперкомпьютерные способности в одной области (например, AlphaFold для белков или Stockfish для шахмат) .
  2. Общий ИИ (General): Способность решать широкий спектр задач.

Уровни общего ИИ:

Уэс Рот высказывает мнение, что с появлением моделей o1 и o3 человечество уже входит в категории «компетентного» или даже «экспертного» AGI . Он аргументирует это тем, что даже если остановить прогресс самих моделей прямо сейчас, создание правильной «оснастки» (scaffolding) и AI-агентов позволит этим моделям выполнять работу на уровне экспертов в большинстве цифровых профессий .

В завершение Рот задаёт вопрос: если график «вертикального» роста способностей при масштабировании времени на размышление сохранится, не окажемся ли мы у порога ASI гораздо быстрее, чем предсказывали самые смелые прогнозы?

💬 Цитаты

«Прямой путь к ASI (искусственному сверхразуму) выглядит все более и более вероятным с каждым месяцем.»

Логан Килпатрик 00:00

«В теории это может быть использовано для того, чтобы языковые модели превзошли человеческий уровень интеллекта.»

Ной Гудман 07:47

«Мы уже имеем узкий сверхразум... но ASI — это когда ИИ превосходит 99% квалифицированных взрослых в широком спектре задач.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
ASI
Artificial Super Intelligence — гипотетический уровень ИИ, значительно превосходящий лучших представителей человечества в любой области.
Test-time compute
Вычислительные ресурсы, затрачиваемые моделью в момент генерации ответа для улучшения его качества (рассуждение, перебор вариантов).
ARC-AGI
Абстрактный тест на интеллект, измеряющий способность решать совершенно новые задачи, которые не встречались в обучающей выборке.
STaR
Self-Taught Reasoner — метод обучения, при котором модель сама генерирует рассуждения и учится на тех, что привели к верному ответу.
📊 Цифры
🗓 Хронология
  1. 2017 Google публикует статью о трансформерах, заложив основу современных LLM.
  2. Май 2022 Публикация статьи о методе STaR (Self-Taught Reasoner) исследователями Стэнфорда и Google.
  3. Март 2024 Выход статьи Quiet-STaR о моделях, которые думают перед тем, как говорить.
  4. Июль 2024 Первые официальные сообщения о работе OpenAI над технологией Strawberry.
  5. Сентябрь 2024 Выход статьи Сэма Олтмена 'The Intelligence Age' и релиз моделей o1-preview.
⚖️ Другая сторона
Искусственный интеллект Logan Kilpatrick Ilya Sutskever OpenAI o1 Test-time compute ARC-AGI