# Как Google увеличил использование ИИ в 50 раз за год: Логан Килпатрик о трансформации DeepMind и будущем Gemini

Источник: https://www.youtube.com/watch?v=kp9afmazO_w
Канал: The Cognitive Revolution
Опубликовано: 12.06.2025

---

В новом эпизоде подкаста The Cognitive Revolution ведущий Натан Лабенц обсуждает с Логаном Килпатриком (Logan Kilpatrick), руководителем по развитию ИИ в Google, беспрецедентную скорость изменений в индустрии. Основной темой разговора стала трансформация Google из «спящего гиганта» в доминирующую силу, чей объем обработки токенов вырос в 50 раз всего за один год.

## 📈 Феноменальный рост и организационная трансформация Google
[[JUMP:0:39]]

За последний год объем использования ИИ в сервисах Google увеличился в 50 раз: с 10 триллионов токенов в месяц до 500 триллионов сегодня [0:39]. По подсчетам ведущего, это эквивалентно 50 000 токенов в месяц на каждого жителя Земли [18:56]. Логан Килпатрик отмечает, что за этими цифрами стоит глубокая внутренняя перестройка компании.

Ключевые этапы трансформации:

*   **Слияние подразделений:** В середине 2023 года команды Google Brain и DeepMind объединились под руководством Демиса Хассабиса [10:09]. Это позволило консолидировать ресурсы и сфокусироваться на едином векторе развития серии моделей Gemini.
*   **Смена парадигмы:** DeepMind перешел от формата организации, занимающейся фундаментальными исследованиями, к созданию конкретных продуктов (Gemini App, Notebook LM, инструменты для разработчиков) [12:55].
*   **Инфраструктурный рывок:** Рост потребления потребовал масштабного развертывания тензорных процессоров (TPU). Логан подчеркивает, что такие мощности невозможно создать мгновенно — это результат долгосрочного планирования циклов обучения и инференса [11:50].

По мнению Логана Килпатрика, Google всегда была ИИ-компанией (вспоминая архитектуру Transformer, созданную в ее стенах), но сейчас эта технология стала фундаментом всех продуктов — от поиска и Docs до Waymo и YouTube [15:14].

## ⚔️ Конвергенция или дивергенция: будущее рынка моделей
[[JUMP:20:03]]

В индустрии ведутся споры о том, будут ли модели разных лабораторий становиться всё более похожими (конвергенция) или же начнут радикально различаться.

Логан Килпатрик склоняется к сценарию дивергенции по следующим причинам:

1.  **Сложность инноваций:** «Низковисящие фрукты» уже собраны [20:03]. Дальнейшее улучшение моделей требует колоссальных инвестиций и уникальных архитектурных решений, которые под силу не всем.
2.  **Инфраструктурные преимущества:** Google обладает одной из самых мощных вычислительных инфраструктур в мире, что дает компании возможность делать ставки, недоступные конкурентам [20:31].
3.  **Специализация:** Хотя крупные лаборатории стремятся к универсальности (AGI), Логан Килпатрик допускает, что некоторые игроки (например, Anthropic) могут сфокусироваться на узких нишах, таких как идеальное написание кода, чтобы построить устойчивый бизнес [21:22].

## 🚀 Стартапы против Big Tech: в чем преимущество малых команд?
[[JUMP:24:25]]

Несмотря на доминирование гигантов, Логан Килпатрик утверждает, что сейчас — лучшее время в истории человечества для запуска стартапа [24:38].

Его аргументы в пользу стартапов:

*   **Фокус и скорость:** Большие компании обременены процессами безопасности, комплаенса и необходимостью поддерживать продукты с миллиардами пользователей. Стартап может сфокусироваться на одной задаче и итерировать её в разы быстрее [27:43].
*   **Инструментарий:** Барьер входа в разработку ПО никогда не был таким низким. ИИ-агенты позволяют маленьким командам создавать продукты, которые раньше требовали десятков инженеров [25:31].
*   **Кастомизация:** Стартапы могут глубже погружаться в специфические сегменты пользователей, предлагая решения, которые слишком узки для универсальных моделей Google или OpenAI [25:45].

Ведущий Натан Лабенц приводит в пример компанию Cursor (AI-редактор кода), которая недавно объявила о достижении выручки (ARR) в $500 млн [24:12]. Логан признает их успех, но отмечает, что Google Cloud стремится быть партнером для таких компаний, предоставляя им инфраструктуру через API, а не просто конкурировать с ними [31:14].

## 🧠 Технологические прорывы: Gemini 2.5 Pro и длинный контекст
[[JUMP:40:21]]

Одной из самых обсуждаемых тем стала способность моделей работать с огромными объемами данных. Gemini 2.5 Pro демонстрирует значительный отрыв в тестах на «длинный контекст» (long context).

Технические детали и наблюдения:

*   **Превосходство в бенчмарках:** Логан демонстрирует данные теста OpenAI MRCR (8 иголок в стоге сена), где новая Gemini 2.5 Pro работает на 20% лучше конкурентов при извлечении множественных фактов из контекста [43:55].
*   **Слияние контекста и рассуждений:** По словам Логана, именно улучшение способностей к рассуждению (reasoning) позволяет модели эффективно использовать всё окно контекста, не теряя нить повествования [44:47].
*   **Смена паттернов использования:** Раньше пользователи редко загружали огромные файлы, не веря в возможности моделей. С выходом 2.5 Pro Google наблюдает резкий рост запросов с использованием миллионов токенов [46:05].

Натан Лабенц делится личным опытом: он загрузил в Gemini всю историю своей переписки в Gmail (около 1 млн токенов), и модель смогла сформировать удивительно точный портрет его личности и рабочих привычек [47:10].

## ⚡ Диффузионные языковые модели: конец эпохи трансформеров?
[[JUMP:1:07:04]]

Логан Килпатрик анонсировал работу Google над новым типом языковых моделей, основанных на диффузии (аналогично генераторам изображений, таким как Imagen).

Преимущества диффузионных LLM:

1.  **Невероятная скорость:** Они генерируют текст в разы быстрее традиционных авторегрессионных моделей (как GPT) [1:08:00].
2.  **Нелинейность:** В отличие от посимвольной генерации, диффузионная модель формирует ответ «целиком», постепенно уточняя детали, что ближе к человеческому мышлению [1:07:18].
3.  **Персонализированный интерфейс:** Такая скорость позволяет создавать UI, который перерисовывается мгновенно в ответ на действия пользователя [1:08:39].

## 🤖 Путь к AGI и будущее человеческого труда
[[JUMP:1:09:45]]

Обсуждая путь к сильному искусственному интеллекту (AGI), Логан Килпатрик выдвигает тезис: AGI станет не просто мощной моделью, а «продуктовым опытом» [1:09:59]. Он считает, что мы не проснемся в один день с «готовым AGI», а увидим, как существующие системы обрастают памятью и инструментами, пока их поведение не станет неотличимым от разумного.

Отношение Логана к ИИ в личной жизни:

*   **Отказ от помощи ИИ:** Логан утверждает, что 95% его писем и твитов написаны им самим без участия ИИ [1:13:57]. Для него критически важно сохранять собственную «агентность» и уникальный тон.
*   **Ценность человеческого контента:** По мнению гостя, в мире, где ИИ может генерировать бесконечный объем контента, ценность человеческого взгляда и опыта будет только расти [1:16:01]. Мы слушаем подкасты не ради сухих фактов, а ради личности ведущего.
*   **Новые возможности:** ИИ может взять на себя рутину, позволяя людям больше фокусироваться на межличностных связях [1:18:13].

В завершение Логан Килпатрик пригласил разработчиков обращаться к нему напрямую (lkilpatrick@google.com), чтобы получить ранний доступ к новым API Google, подчеркнув, что компания стремится быть максимально открытой к фидбеку от комьюнити [48:57].