Математический триумф ИИ: детали победы Gemini DeepThink и OpenAI на IMO

Wes Roth 76,9 тыс. 17 мин 4 мин 21.07.2025
Главное

В мире искусственного интеллекта произошло знаковое событие: сразу два технологических гиганта, Google и OpenAI, объявили о достижении «золотого стандарта» на Международной математической олимпиаде (IMO). Это достижение не только демонстрирует прогресс в области рассуждений ИИ, но и сопровождается кулуарными спорами о профессиональной этике и методах оценки результатов.

🥇 Золотая лихорадка на математическом олимпе 0:00

Google DeepMind официально подтвердила, что их модель Gemini с технологией DeepThink завоевала условную золотую медаль на IMO . Ранее о похожем результате заявила компания OpenAI. Оба ИИ-агента набрали одинаковое количество баллов — 35 из 42 возможных, решив пять из шести сложнейших задач .

Интересные факты о соревновании:

⚔️ Скандал вокруг анонса: OpenAI против этики IMO? 1:21

Ситуация вокруг объявления результатов OpenAI вызвала волну критики в индустрии. Появились слухи, что оргкомитет IMO просил технологические компании подождать неделю после церемонии закрытия, чтобы не отвлекать внимание от достижений детей-участников . OpenAI, однако, опубликовала новость раньше.

Позиции сторон:

  1. Аргументы критиков: OpenAI якобы проигнорировала просьбу организаторов ради «хайпа» и возможности перехватить информационную повестку у Google.
  2. Позиция OpenAI: Ноам Браун, авторитетный исследователь компании, решительно отверг обвинения. Он утверждает, что пост был опубликован уже после завершения прямой трансляции церемонии закрытия . По его словам, OpenAI вообще не вела официальных переговоров с IMO, а Браун лишь лично предупредил одного из организаторов перед публикацией .
  3. Позиция Google DeepMind: Демис Хассабис, глава DeepMind, пояснил, что его компания не делала анонсов в пятницу именно из уважения к просьбе совета IMO дождаться верификации результатов экспертами и официального награждения студентов .

Сам Уэс Рот признает, что ситуация неоднозначная: оба спикера (Браун и Хассабис) пользуются огромным уважением, и это может быть как «проделкой» отдела маркетинга OpenAI, так и простым недопониманием .

🧠 Технологический стек: DeepThink и параллельные миры 4:15

Модель Gemini с приставкой «DeepThink» не является просто стандартным чат-ботом. Это специализированная версия, прошедшая дополнительное обучение.

Ключевые технические особенности Gemini DeepThink:

Уэс Рот отмечает, что Google обещает сделать эту модель доступной для подписчиков плана Google AI Ultra после завершения тестирования «красными командами» (red teamers) .

🏋️ «Тренажерный зал» для ИИ: новая парадигма AGI 11:34

Одной из самых глубоких идей видео является мысль исследователя Вула Брауна, которую поддерживает и автор канала: «Настоящим AGI является не конкретная модель (чекпоинт), а RL-система внутри компании, которая её создает» .

Андрей Карпати предложил аналогию «спортивного зала» или «буткемпа» для нейросетей . Процесс выглядит так:

  1. Пре-тренинг: Модель поглощает интернет, приобретая общие знания.
  2. RL-тренировка: Модель отправляется в «зал» (Reinforcement Learning Gym), где на огромных вычислительных мощностях учится решать специфические задачи — математику или код .

Этот подход подтверждается примером Илона Маска, который использовал суперкомпьютер Colossus для обучения Grok 3. По данным Рота, Маск задействовал в 10 раз больше мощностей для обучения с подкреплением (RL), чем в предыдущей версии . По мнению Рота, это позволило превратить «среднюю» модель в одну из лучших на рынке .

📉 Уроки AlphaZero и синтетические данные 12:49

Будущее ИИ, по мнению многих экспертов, заключается в отказе от человеческих данных. Это так называемый «урок AlphaZero» — алгоритма, который научился играть в шахматы и го лучше людей, играя сам с собой, а не изучая человеческие партии .

Путь к прогрессу включает:

Интересно, что эксперты недооценили скорость прогресса. Рынки ставок оценивали вероятность победы ИИ на IMO в этом году всего в 10-15% . Даже Элиезер Юдковский прогнозировал лишь 16% шансов на «золото» к 2025 году . ИИ в очередной раз опередил самые смелые прогнозы скептиков и оптимистов.

💬 Цитаты

«Я склонен говорить, что системой AGI является сама RL-система внутри OpenAI, а не какая-то фиксированная модель на выходе.»

Вул Браун (цитата Уэса Рота) 11:34

«Хотя это заметная веха, для ИИ это уже становится почти тривиальным.»

Илон Маск (комментарий под постом Google) 07:19
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
IMO
Международная математическая олимпиада для школьников старших классов, считающаяся одним из самых престижных интеллектуальных соревнований.
Reinforcement Learning (RL)
Метод обучения ИИ, при котором модель получает вознаграждение за правильные действия и штрафы за ошибки.
AGI
Искусственный общий интеллект, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
Lean
Язык программирования и интерактивная система доказательства теорем.
📊 Цифры
🗓 Хронология
  1. 2024 Google DeepMind получает серебряную медаль на IMO с помощью специализированных моделей AlphaGeometry 2.
  2. 2025 Google и OpenAI одновременно заявляют о достижении уровня золотой медали с использованием универсальных LLM.
⚖️ Другая сторона
Искусственный интеллект Google DeepMind OpenAI Gemini DeepThink IMO 2025 Ноам Браун