Техлид Gemini 2.5 Джек Рэй о цепочках мыслей, латентном пространстве и пути к AGI

The Cognitive Revolution 35 тыс. 1 ч 14 мин 4 мин 05.04.2025
Главное

Выход Gemini 2.5 Pro стал важной вехой для Google DeepMind: многие эксперты впервые признали модель от Google лидером по ключевым показателям, особенно в работе с длинным контекстом и сложными рассуждениями. Технический руководитель проекта Джек Рэй (Jack Rae) в интервью для The Cognitive Revolution раскрывает внутреннюю кухню разработки «думающих» моделей, объясняет роль обучения с подкреплением (RL) и делится прогнозами о том, как интеграция памяти и мультимодальности приближает индустрию к созданию AGI.

🧠 Эволюция «мышления»: почему прорыв в рассуждениях случился именно сейчас 7:41

На рынке ИИ наблюдается массовый переход к моделям, которые тратят больше вычислительных ресурсов на этапе вывода (inference-time compute), демонстрируя процесс «размышления» через цепочки мыслей (Chain of Thought). По мнению Джека Рэя, это не является внезапным качественным скачком или случайным открытием .

Основные тезисы Джека Рэя о прогрессе в рассуждениях:

Первые «искры» успеха команда заметила в прошлом году, когда в процессе RL модель начала самостоятельно демонстрировать навыки самоисправления и исследования альтернативных путей решения задачи .

⛓️ Цепочка мыслей: прозрачность против скрытого обмана 28:08

В отличие от OpenAI, которая скрывает полные цепочки мыслей своих моделей o1, Google в Gemini 2.5 Pro предоставляет пользователям доступ к сырым токенам рассуждений (в AI Studio и приложении Gemini) .

Обсуждая этот подход, Джек Рэй и Натан Лабенц затронули следующие аспекты:

По словам Рэя, формат подачи мыслей пользователю (сырые токены, суммаризация или графическая структура) — это область активных экспериментов, и окончательное решение еще не принято .

🌫️ Рассуждения в латентном пространстве 42:24

Интересной альтернативой явным текстовым цепочкам мыслей является «рассуждение в латентном пространстве» (недавняя работа Meta). Вместо генерации токенов модель прокручивает свои «мысли» внутри скрытых векторов.

Джек Рэй проводит аналогию с алгоритмом MuZero :

Однако гость признает наличие философского вопроса: насколько глубоко мы сможем понимать внутренние процессы ИИ, если они не будут выражены словами. Он надеется, что более мощные модели сами станут инструментами для развития «механистической интерпретируемости» .

📚 Длинный контекст как ключ к качеству AGI 1:07:57

Ведущий Натан Лабенц поделился личным опытом: он загрузил в Gemini 2.5 Pro исследовательскую кодовую базу объемом 400 000 токенов . По его словам, модель продемонстрировала не просто «чтение», а глубокое понимание структуры кода, что качественно отличает её от предыдущих версий.

Джек Рэй подчеркивает важность синергии:

  1. Длинный контекст (1M+ токенов): Позволяет модели оперировать огромными массивами данных (целые книги, библиотеки кода, часы видео) .
  2. Глубокое рассуждение: Дает возможность эффективно анализировать этот контекст, не теряя мелких деталей.
  3. Результат: Согласно лидерборду XLR, Gemini 2.5 Pro использует контекст в 128k токенов эффективнее любой другой существующей модели, фактически «изучая» информацию, а не просто сканируя её .

🛤️ Дорожная карта к AGI: Память и мультимодальность 56:55

Джек Рэй, чей научный путь начался с изучения эпизодической памяти в 2014 году под руководством Демиса Хассабиса, считает, что вопрос памяти еще не решен окончательно .

Будущее архитектур, по мнению эксперта:

На текущем этапе Gemini 2.5 Pro имеет статус «экспериментальной» модели. Джек Рэй пояснил, что это позволяет быстрее собирать отзывы пользователей перед общим релизом (General Availability), в рамках которого будут представлены полные технические отчеты и системные карты (System Cards) с деталями тестирования безопасности .

💬 Цитаты

«Внутренние метрики улучшаются с почти пугающей предсказуемостью, напоминая закон Мура.»

«Мы хотим, чтобы эти мысли на самом деле улучшали фактичность, безопасность и возможности модели.»

«Я чувствую AGI, используя 2.5 Pro. Она может за один раз освоить сложные кодовые базы, что казалось футуристичным еще 3 года назад.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Chain of Thought (CoT)
Техника рассуждений ИИ, при которой модель генерирует промежуточные шаги решения задачи перед выдачей финального ответа.
Latent Space (Латентное пространство)
Внутреннее математическое представление данных в нейросети в виде многомерных векторов.
Reinforcement Learning (RL)
Метод обучения ИИ, основанный на получении вознаграждения за правильные действия (например, верное решение математической задачи).
AGI
Искусственный общий интеллект, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
📊 Цифры
🗓 Хронология
  1. 2014 Джек Рэй присоединяется к DeepMind для изучения эпизодической памяти.
  2. Сентябрь 2023 В Google сформированы специальные группы для работы над рассуждениями и временем вывода.
  3. Декабрь 2023 Запуск экспериментальной модели Flash с поддержкой функций мышления.
  4. Январь 2024 Обновление моделей и развитие функций рассуждений.
⚖️ Другая сторона
Искусственный интеллект Gemini 2.5 Jack Rae Google DeepMind Chain of Thought Reinforcement Learning