Боб Макгрю: «Код рассуждений взломан, на очереди — агенты и роботы»

Y Combinator 49,7 тыс. 30 мин 4 мин 31.01.2025
Главное

Бывший технический директор OpenAI Боб Макгрю (Bob McGrew) в интервью Y Combinator раскрывает внутреннюю кухню создания самых мощных ИИ-моделей современности. Он анализирует путь от первых экспериментов с роборуками до прорыва моделей рассуждения ($o1$, $o3$) и объясняет, почему следующая революция произойдет не в чат-ботах, а в автономных агентах и робототехнике.

🚀 От сборки кубика Рубика до GPT: как OpenAI сделала ставку на масштаб 2:02

В начале пути OpenAI целью было создание AGI, но стратегия достижения этой цели была, по признанию Боба Макгрю, «плохой теорией». Ранняя команда, состоящая из выходцев из стартап-среды (Сэм Альтман, Грег Брокман), чувствовала себя неуютно в академическом формате написания статей.

Первые значимые инсайты были получены в проектах, далеких от текста:

Параллельно Алек Рэдфорд (Alec Radford) работал над GPT-1. Боб Макгрю отмечает, что в то время идея предсказания следующего токена как основы интеллекта казалась неочевидной, и Алеку пришлось упорствовать годами, чтобы доказать её жизнеспособность. Сочетание архитектуры трансформеров Алека и принципов масштабирования из DOTA привело к созданию GPT-2, GPT-3 и GPT-4.

🧠 Культурный код: OpenAI против Google Brain и DeepMind 5:04

Боб Макгрю сравнивает подходы ведущих ИИ-лабораторий, выделяя три разные философии:

  1. DeepMind: Централизованный план Демиса Хассабиса, где исследователи нанимались под конкретную стратегию.
  2. Google Brain: Академическая среда, где талантливым ученым давали неограниченные ресурсы и полную свободу в надежде на случайные прорывы.
  3. OpenAI: Подход стартапа. Не было жесткого централизованного плана, но было четкое «мнение» руководства (Ильи Суцкевера, Дарио Амодеи) о том, что нужно доказывать эффективность масштабирования.

Особое внимание уделялось борьбе с «одержимостью авторством», характерной для академии. Чтобы избежать конфликтов за место в списке авторов, в ранних работах по робототехнике авторы указывались просто как «OpenAI». Долгое время в компании практически не было официальных титулов, кроме CEO.

🧱 Тупик данных и новая S-кривая: эпоха рассуждений ($o1$ и $o3$) 9:14

По мнению Боба Макгрю, прогресс ИИ сейчас сталкивается с «ценой данных» (data wall). Традиционное масштабирование путем простого увеличения корпусов текстов для обучения достигает своих пределов.

Однако гость утверждает, что закон Мура в ИИ продолжается через смену механизмов. На смену простому пре-трейнингу приходят рассуждения (reasoning) и вычисления во время инференса (test-time compute).

Ключевые тезисы о новом этапе:

🤖 Автономные агенты: от 90% до 99.9% надежности 14:44

Рассуждения — это не просто умение решать задачи, это фундамент для создания агентов. По словам Боба Макгрю, «длинное мышление» позволяет модели строить связные цепочки действий в реальном или виртуальном мире.

Главный барьер для внедрения агентов — надежность. Гость приводит эмпирическое правило: для добавления каждой «девятки» к показателю точности (с 90% до 99% или с 99% до 99.9%) требуется увеличение вычислительной мощности на порядок. Раньше это достигалось только обучением более крупных моделей, теперь — за счет того, что модель дольше «думает» над задачей.

Боб Макгрю прогнозирует появление глубоко персонализированных ИИ-ботов, которые будут иметь доступ к Slack, Gmail и другим инструментам сотрудника, чтобы действовать от его имени.

🛠 Почему ИИ-революция буксует и при чем здесь Palantir 20:40

Собеседники обсуждают парадокс: несмотря на то, что современные ИИ-модели уже в 2018 году казались «концом истории» для многих профессий, массового замещения рабочих мест не произошло. Боб Макгрю связывает это с отсутствием нужного софта и интерфейсов.

Решением может стать концепция «Forward Deployed Engineer» (инженер передового развертывания), которую практиковала компания Palantir.

🎨 Будущее: Genius, Manager и «ChatGPT момент» для роботов 24:49

Боб Макгрю сохраняет оптимизм относительно будущего труда. Он сравнивает текущую ситуацию с автоматизацией сельского хозяйства в 1880-х годах: тогда 90% рабочих мест исчезло, но появились профессии, которые фермеры того времени даже не смогли бы вообразить.

По мнению спикера, в будущем останутся две основные роли для человека:

  1. Одинокий гений (Lone Genius): Исследователь, который использует ИИ как рычаг для реализации невероятных идей.
  2. Менеджер: Руководитель «фирмы», состоящей преимущественно из ИИ-агентов.

Что касается робототехники, Макгрю считает, что она находится в той же точке, где LLM были 5 лет назад. Он предсказывает, что в ближайшие 5 лет мы увидим «ChatGPT момент» для роботов благодаря созданию фундаментальных моделей физического интеллекта. Это позволит автоматизировать не только цифровой труд, но и проведение научных экспериментов в физических лабораториях.

💬 Цитаты

«Мы достигаем узкого места в предварительном обучении и данных, но теперь у нас есть новый механизм с рассуждениями и вычислениями во время тестирования.»

Боб Макгрю 12:33

«В будущем останется две роли: одинокий гений и менеджер, который будет CEO своей фирмы, состоящей преимущественно из ИИ.»

Боб Макгрю 26:05

«Робототехнические компании сейчас находятся там же, где компании LLM были 5 лет назад.»

Боб Макгрю 28:27
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Test-time compute
Метод, при котором модели ИИ выделяется больше вычислительных ресурсов во время генерации ответа, чтобы она могла «подумать» и выдать более качественный результат.
Scaling Laws
Математические закономерности, описывающие, как производительность модели растет при увеличении объема данных, вычислительной мощности и количества параметров.
Forward Deployed Engineer
Специалист, работающий на стороне клиента для глубокой адаптации и интеграции сложного технологического продукта под конкретные бизнес-задачи.
📊 Цифры
🗓 Хронология
  1. 2015 Боб Макгрю уходит из Palantir и начинает изучать глубокое обучение через робототехнику.
  2. 2018 OpenAI начинает работу над GPT-1.
  3. 2024-2025 Выход моделей рассуждения o1 и o3, знаменующий переход к новому этапу масштабирования.
⚖️ Другая сторона
Искусственный интеллект Bob McGrew OpenAI AGI scaling laws o1