Как Google увеличил использование ИИ в 50 раз за год: Логан Килпатрик о трансформации DeepMind и будущем Gemini

The Cognitive Revolution 33,3 тыс. 1 ч 24 мин 5 мин 12.06.2025
Главное

В новом эпизоде подкаста The Cognitive Revolution ведущий Натан Лабенц обсуждает с Логаном Килпатриком (Logan Kilpatrick), руководителем по развитию ИИ в Google, беспрецедентную скорость изменений в индустрии. Основной темой разговора стала трансформация Google из «спящего гиганта» в доминирующую силу, чей объем обработки токенов вырос в 50 раз всего за один год.

📈 Феноменальный рост и организационная трансформация Google 0:39

За последний год объем использования ИИ в сервисах Google увеличился в 50 раз: с 10 триллионов токенов в месяц до 500 триллионов сегодня . По подсчетам ведущего, это эквивалентно 50 000 токенов в месяц на каждого жителя Земли . Логан Килпатрик отмечает, что за этими цифрами стоит глубокая внутренняя перестройка компании.

Ключевые этапы трансформации:

По мнению Логана Килпатрика, Google всегда была ИИ-компанией (вспоминая архитектуру Transformer, созданную в ее стенах), но сейчас эта технология стала фундаментом всех продуктов — от поиска и Docs до Waymo и YouTube .

⚔️ Конвергенция или дивергенция: будущее рынка моделей 20:03

В индустрии ведутся споры о том, будут ли модели разных лабораторий становиться всё более похожими (конвергенция) или же начнут радикально различаться.

Логан Килпатрик склоняется к сценарию дивергенции по следующим причинам:

  1. Сложность инноваций: «Низковисящие фрукты» уже собраны . Дальнейшее улучшение моделей требует колоссальных инвестиций и уникальных архитектурных решений, которые под силу не всем.
  2. Инфраструктурные преимущества: Google обладает одной из самых мощных вычислительных инфраструктур в мире, что дает компании возможность делать ставки, недоступные конкурентам .
  3. Специализация: Хотя крупные лаборатории стремятся к универсальности (AGI), Логан Килпатрик допускает, что некоторые игроки (например, Anthropic) могут сфокусироваться на узких нишах, таких как идеальное написание кода, чтобы построить устойчивый бизнес .

🚀 Стартапы против Big Tech: в чем преимущество малых команд? 24:25

Несмотря на доминирование гигантов, Логан Килпатрик утверждает, что сейчас — лучшее время в истории человечества для запуска стартапа .

Его аргументы в пользу стартапов:

Ведущий Натан Лабенц приводит в пример компанию Cursor (AI-редактор кода), которая недавно объявила о достижении выручки (ARR) в $500 млн . Логан признает их успех, но отмечает, что Google Cloud стремится быть партнером для таких компаний, предоставляя им инфраструктуру через API, а не просто конкурировать с ними .

🧠 Технологические прорывы: Gemini 2.5 Pro и длинный контекст 40:21

Одной из самых обсуждаемых тем стала способность моделей работать с огромными объемами данных. Gemini 2.5 Pro демонстрирует значительный отрыв в тестах на «длинный контекст» (long context).

Технические детали и наблюдения:

Натан Лабенц делится личным опытом: он загрузил в Gemini всю историю своей переписки в Gmail (около 1 млн токенов), и модель смогла сформировать удивительно точный портрет его личности и рабочих привычек .

⚡ Диффузионные языковые модели: конец эпохи трансформеров? 1:07:04

Логан Килпатрик анонсировал работу Google над новым типом языковых моделей, основанных на диффузии (аналогично генераторам изображений, таким как Imagen).

Преимущества диффузионных LLM:

  1. Невероятная скорость: Они генерируют текст в разы быстрее традиционных авторегрессионных моделей (как GPT) .
  2. Нелинейность: В отличие от посимвольной генерации, диффузионная модель формирует ответ «целиком», постепенно уточняя детали, что ближе к человеческому мышлению .
  3. Персонализированный интерфейс: Такая скорость позволяет создавать UI, который перерисовывается мгновенно в ответ на действия пользователя .

🤖 Путь к AGI и будущее человеческого труда 1:09:45

Обсуждая путь к сильному искусственному интеллекту (AGI), Логан Килпатрик выдвигает тезис: AGI станет не просто мощной моделью, а «продуктовым опытом» . Он считает, что мы не проснемся в один день с «готовым AGI», а увидим, как существующие системы обрастают памятью и инструментами, пока их поведение не станет неотличимым от разумного.

Отношение Логана к ИИ в личной жизни:

В завершение Логан Килпатрик пригласил разработчиков обращаться к нему напрямую (lkilpatrick@google.com), чтобы получить ранний доступ к новым API Google, подчеркнув, что компания стремится быть максимально открытой к фидбеку от комьюнити .

💬 Цитаты

«Для Google это был год 50-кратного роста: с 10 триллионов токенов в месяц до 500 триллионов.»

Логан Килпатрик 0:39

«AGI станет продуктовым опытом. Кто-то объединит правильные компоненты на уровне продукта с умной моделью, и это станет тем самым моментом.»

Логан Килпатрик 1:11:18
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Токен
Единица текста (слово или часть слова), которую обрабатывает нейросеть.
Длинный контекст (Long Context)
Способность модели удерживать в памяти и анализировать огромные объемы данных за один запрос (миллионы слов).
Диффузионная модель
Тип нейросети, который создает контент, постепенно убирая «шум» из данных, обычно используется для изображений.
📊 Цифры
🗓 Хронология
  1. середина 2023 Слияние Google Brain и DeepMind в единое подразделение Google DeepMind.
  2. май 2025 Период (неделя), когда вышло рекордное количество обновлений ИИ-моделей.
⚖️ Другая сторона
Искусственный интеллект Логан Килпатрик Gemini 2.5 Pro Google DeepMind AGI Notebook LM