# Математический триумф ИИ: детали победы Gemini DeepThink и OpenAI на IMO

Источник: https://www.youtube.com/watch?v=36HchiQGU4U
Канал: Wes Roth
Опубликовано: 21.07.2025

---

В мире искусственного интеллекта произошло знаковое событие: сразу два технологических гиганта, Google и OpenAI, объявили о достижении «золотого стандарта» на Международной математической олимпиаде (IMO). Это достижение не только демонстрирует прогресс в области рассуждений ИИ, но и сопровождается кулуарными спорами о профессиональной этике и методах оценки результатов.

## 🥇 Золотая лихорадка на математическом олимпе
[[JUMP:00:00]]

Google DeepMind официально подтвердила, что их модель Gemini с технологией DeepThink завоевала условную золотую медаль на IMO [0:00]. Ранее о похожем результате заявила компания OpenAI. Оба ИИ-агента набрали одинаковое количество баллов — 35 из 42 возможных, решив пять из шести сложнейших задач [0:28].

Интересные факты о соревновании:

*   **Результативность:** Модели от Google и OpenAI споткнулись на одной и той же шестой задаче, которая, судя по всему, стала непреодолимым барьером для текущих алгоритмов [0:40].
*   **Превосходство человека:** Несмотря на триумф машин, пять участников-людей (Иван, Цзян, Дэн, Уоррен и Сатоши) набрали идеальные 42 балла, решив все задачи [1:08]. Ведущий Уэс Рот иронично замечает: «Мы всё еще в игре, человечество пока не списано в утиль» [1:21].
*   **Формат:** В отличие от прошлых лет, в 2025 году модели использовали «чистый» LLM-подход. Им не требовался перевод условий на формальные языки программирования (вроде Lean); нейросети читали и решали задачи на естественном языке, как это делают люди [3:09].

## ⚔️ Скандал вокруг анонса: OpenAI против этики IMO?
[[JUMP:01:21]]

Ситуация вокруг объявления результатов OpenAI вызвала волну критики в индустрии. Появились слухи, что оргкомитет IMO просил технологические компании подождать неделю после церемонии закрытия, чтобы не отвлекать внимание от достижений детей-участников [1:47]. OpenAI, однако, опубликовала новость раньше.

Позиции сторон:

1.  **Аргументы критиков:** OpenAI якобы проигнорировала просьбу организаторов ради «хайпа» и возможности перехватить информационную повестку у Google.
2.  **Позиция OpenAI:** Ноам Браун, авторитетный исследователь компании, решительно отверг обвинения. Он утверждает, что пост был опубликован уже после завершения прямой трансляции церемонии закрытия [2:15]. По его словам, OpenAI вообще не вела официальных переговоров с IMO, а Браун лишь лично предупредил одного из организаторов перед публикацией [2:30].
3.  **Позиция Google DeepMind:** Демис Хассабис, глава DeepMind, пояснил, что его компания не делала анонсов в пятницу именно из уважения к просьбе совета IMO дождаться верификации результатов экспертами и официального награждения студентов [15:13].

Сам Уэс Рот признает, что ситуация неоднозначная: оба спикера (Браун и Хассабис) пользуются огромным уважением, и это может быть как «проделкой» отдела маркетинга OpenAI, так и простым недопониманием [15:51].

## 🧠 Технологический стек: DeepThink и параллельные миры
[[JUMP:04:15]]

Модель Gemini с приставкой «DeepThink» не является просто стандартным чат-ботом. Это специализированная версия, прошедшая дополнительное обучение.

Ключевые технические особенности Gemini DeepThink:

*   **Reinforcement Learning (RL):** Модель обучали с использованием новых методов обучения с подкреплением, ориентированных на многошаговые рассуждения и доказательство теорем [4:56].
*   **Подсказки и база знаний:** Google предоставила модели доступ к курируемому корпусу высококачественных математических решений и добавила общие советы по подходу к олимпиадным задачам в системные инструкции [5:10].
*   **Параллельное мышление:** В отличие от линейной цепочки мыслей, Gemini DeepThink способна одновременно исследовать несколько возможных путей решения задачи и объединять их для финального ответа [5:37].

Уэс Рот отмечает, что Google обещает сделать эту модель доступной для подписчиков плана Google AI Ultra после завершения тестирования «красными командами» (red teamers) [5:24].

## 🏋️ «Тренажерный зал» для ИИ: новая парадигма AGI
[[JUMP:11:34]]

Одной из самых глубоких идей видео является мысль исследователя Вула Брауна, которую поддерживает и автор канала: «Настоящим AGI является не конкретная модель (чекпоинт), а RL-система внутри компании, которая её создает» [11:34].

Андрей Карпати предложил аналогию «спортивного зала» или «буткемпа» для нейросетей [11:59]. Процесс выглядит так:

1.  **Пре-тренинг:** Модель поглощает интернет, приобретая общие знания.
2.  **RL-тренировка:** Модель отправляется в «зал» (Reinforcement Learning Gym), где на огромных вычислительных мощностях учится решать специфические задачи — математику или код [12:12].

Этот подход подтверждается примером Илона Маска, который использовал суперкомпьютер Colossus для обучения Grok 3. По данным Рота, Маск задействовал в 10 раз больше мощностей для обучения с подкреплением (RL), чем в предыдущей версии [10:04]. По мнению Рота, это позволило превратить «среднюю» модель в одну из лучших на рынке [10:17].

## 📉 Уроки AlphaZero и синтетические данные
[[JUMP:12:49]]

Будущее ИИ, по мнению многих экспертов, заключается в отказе от человеческих данных. Это так называемый «урок AlphaZero» — алгоритма, который научился играть в шахматы и го лучше людей, играя сам с собой, а не изучая человеческие партии [13:42].

Путь к прогрессу включает:

*   Генерацию синтетических данных и теорем [14:08].
*   Самостоятельную проверку (self-verification) [14:01].
*   Создание ИИ обучающих программ для самого себя.

Интересно, что эксперты недооценили скорость прогресса. Рынки ставок оценивали вероятность победы ИИ на IMO в этом году всего в 10-15% [16:31]. Даже Элиезер Юдковский прогнозировал лишь 16% шансов на «золото» к 2025 году [16:44]. ИИ в очередной раз опередил самые смелые прогнозы скептиков и оптимистов.