Сергей Брин о будущем Gemini: «Прогнозы Курцвейла теперь кажутся консервативными»

Google for Developers 49 тыс. 27 мин 4 мин 23.05.2025
Главное

Спустя десятилетия после того, как Сергей Брин и Ларри Пейдж основали Google, компания переживает один из самых интенсивных периодов трансформации в своей истории. В беседе с Логаном Килпатриком на конференции I/O Сергей Брин поделился своим видением того, как ИИ меняет ДНК компании, почему современный прогресс кажется ему одновременно предсказуемым и поразительным, и почему он решил лично вернуться к работе «в полях» над моделями Gemini.

🧱 Фокус на Gemini: от текста к самосовершенствованию 2:53

Несмотря на широчайший спектр анонсов Google в сфере генеративных медиа (видео, музыка, изображения), Сергей Брин подчеркивает, что его основные усилия сосредоточены на «core text model» — основной текстовой модели Gemini . Брин считает это направление стратегически приоритетным по нескольким причинам:

Особое внимание Брин уделил запуску нативной поддержки аудио в Gemini. По его словам, технологически эта база была заложена в модель еще год назад , однако процесс подготовки к релизу и прохождение всех внутренних «ступеней» заняли больше времени, чем ожидалось.

👁️ За кулисами обучения: как «растут» модели 8:58

Одной из самых захватывающих частей работы, по мнению Брина, является наблюдение за промежуточными результатами обучения (training runs). Этот процесс он описывает как наблюдение за развитием организма:

  1. Промежуточные точки: Разработчики тестируют чекпоинты на 10%, 20% и более этапах обучения .
  2. Траектория развития: Несмотря на слабость модели на ранних этапах, инженеры могут видеть траекторию её будущего прогресса.
  3. Визуализация процесса: В моделях генерации видео (Veo) на ранних стадиях можно увидеть лишь неясные формы и услышать искаженные звуки, которые постепенно обретают четкость к концу забега .

Брин признается, что участие в таких «просмотрах» вызывает смесь нервного напряжения и азарта, так как на кону стоят огромные вычислительные ресурсы и большие ожидания .

🤔 Сюрпризы сингулярности: реальность против ожиданий 10:07

Обсуждая прогнозы футуролога Рэя Курцвейла, который предсказывал наступление технологической сингулярности к 2029–2045 годам, Брин отмечает, что сегодня эти предсказания кажутся даже «консервативными» . Хотя возможность появления ИИ обсуждалась в Google еще 15 лет назад, реальность оказалась полна сюрпризов:

🚀 Культура стартапа внутри гиганта 20:19

Сергей Брин согласен с ведущим в том, что Google сейчас переживает фазу «переизобретения» . После периода адаптации к мобильным технологиям и облачным вычислениям, компания вернулась к своим истокам, ведь работа с данными и машинное обучение всегда были в её ДНК .

В завершение Сергей Брин отметил важность обратной связи от пользователей и работы над такими нюансами, как кэширование, вызов функций (function calling) и стабильность систем при огромных нагрузках . Для него нынешний момент в Google — это не просто релизы продуктов, а масштабная научная работа, которая только начинает приносить плоды.

💬 Цитаты

«Интеллектуально можно обосновать приближение сингулярности... Сегодня кажется, что прогнозы Рэя Курцвейла были даже консервативными.»

Сергей Брин 11:34

«Если вместо того, чтобы выдать ответ за секунду, модель будет думать час, день или месяц — это может стать суперсилой.»

Сергей Брин 18:05
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
TPU (Tensor Processing Unit)
Специализированные ускорители, разработанные Google для задач машинного обучения.
Post-training
Этап дообучения модели (включая RLHF), который составляет всё большую долю в общем процессе создания ИИ.
Soverignity/Singularity
Гипотетический момент, когда технологическое развитие станет неуправляемым и необратимым.
📊 Цифры
🗓 Хронология
  1. 2017 Выход статьи о трансформерах (Transformers), ставших основой современных LLM.
  2. 2024 Запуск модели Gemini 1.5 Pro и демонстрация возможностей Deep Think.
  3. 2025 Ускорение темпов релизов ИИ-продуктов Google по сравнению с предыдущим годом.
⚖️ Другая сторона
Искусственный интеллект Sergey Brin Gemini Google DeepMind TPU v4 Veo