Логан Килпатрик, специалист по продукту в Google AI, в пятый раз становится гостем подкаста The Cognitive Revolution, чтобы подвести итоги беспрецедентной недели в истории ИИ (с 15 по 22 мая 2025 года). В центре дискуссии — фундаментальная трансформация Google из «спящего гиганта» в доминирующую силу, масштабирование мощностей до 500 триллионов токенов в месяц и то, как новые архитектуры моделей меняют саму суть разработки программного обеспечения.
🏗️ Пробуждение гиганта: внутренняя трансформация Google 7:19
Логан Килпатрик описывает последние два года в Google как период радикальной культурной и организационной перестройки. По его словам, долгое время внешние наблюдатели воспринимали компанию как склеротичную структуру, где разрозненные команды (Google Brain, DeepMind, Google Research) работали над пересекающимися задачами без единого вектора .
Ситуация изменилась в середине 2023 года, когда произошло слияние Google Brain и DeepMind. По мнению гостя, это стало отправной точкой для создания структуры, способной лидировать в следующие 10 лет .
Ключевые аспекты трансформации:
- Переход к продуктам: DeepMind эволюционировал из организации, занимавшейся фундаментальными исследованиями, в команду, создающую конечные продукты, такие как Gemini и Notebook LM .
- Иерархия и фокус: Килпатрик отмечает, что Демис Хассабис и руководство DeepMind проделали огромную работу по объединению двух разных культур под одной крышей, что позволило сократить циклы итераций .
- Инфраструктурное преимущество: Google перешла на «военные рельсы», максимально эффективно используя свои TPUs как для обучения моделей следующего поколения, так и для обеспечения масштабного инференса .
📈 Масштаб 500 триллионов токенов: ИИ для каждого человека 11:38
Одной из самых поразительных цифр, озвученных на конференции Google I/O, стал объем обрабатываемых данных: 500 триллионов токенов в месяц . Логан подчеркивает, что это 50-кратный рост по сравнению с показателями годовой давности, когда он только пришел в компанию (тогда объем составлял около 10 триллионов токенов) .
Для контекста: этот объем эквивалентен примерно 50 000 токенов в месяц на каждого жителя Земли . Килпатрик объясняет такой взрывной рост несколькими факторами:
- Глубокая интеграция Gemini во все ключевые продукты Google (Docs, Sheets, Gmail, YouTube) .
- Рост популярности корпоративных облачных решений Google Cloud .
- Использование ИИ в беспилотных автомобилях Waymo и других сервисах экосистемы .
Гость утверждает, что Google максимально мотивирована на успех, так как ИИ теперь является не дополнением, а фундаментом всей бизнес-модели компании .
⚔️ Конкуренция, конвергенция и кейс Windsurf 19:37
Обсуждая текущее состояние рынка, Килпатрик отмечает, что ИИ-экосистема сейчас является самой конкурентной средой в мире с точки зрения талантов, капитала и скорости исполнения .
Наблюдаемую сейчас «конвергенцию» моделей (когда ведущие лаборатории выпускают очень похожие по функциям продукты почти одновременно) Логан объясняет тем, что «низковисящие фрукты» уже собраны . Однако в будущем он ожидает дивергенции:
- Фокус на специализации: Компании могут начать фокусироваться на узких нишах, например, Anthropic может решить стать лучшим только в кодинге (хотя это противоречит их широкой миссии) .
- Инфраструктурный отрыв: Google планирует использовать свое преимущество в виде собственных чипов и вертикально интегрированного стека для создания уникальных возможностей .
Отдельно была затронута тема конфликта Anthropic и Windsurf (после сделки последних с OpenAI). Логан выразил понимание позиции Anthropic, которая решила не предоставлять вычислительные мощности прямым конкурентам, назвав это «защищаемой бизнес-стратегией» . Он подчеркнул, что мандат Google Cloud, напротив, заключается в том, чтобы предоставлять инфраструктуру Google всему миру, позволяя стартапам строить на ней свои решения .
🚀 Gemini 2.5 Pro: Эпоха длинного контекста и рассуждений 40:05
Логан и ведущий Нейтан Лабенц подробно обсудили возможности новой модели Gemini 2.5 Pro. Лабенц поделился личным опытом: он загрузил в модель кодовую базу объемом 500 000 токенов, и Gemini успешно справилась с отладкой сложных скриптов, переписывая целые файлы без потери контекста .
Килпатрик выделил ключевые технические достижения:
- Benchmark MRCR: В тестах на извлечение множественных объектов из контекста (Multi-Needle) новая версия Gemini 2.5 Pro показывает результат на 20% лучше конкурентов .
- Слияние контекста и рассуждений: По словам гостя, именно продвинутые способности к рассуждению (reasoning) позволяют модели эффективно использовать окно контекста в миллион и более токенов .
- Изменение поведения пользователей: С выходом 2.5 Pro Google зафиксировала резкий сдвиг в сторону запросов с огромным объемом данных (видео, целые репозитории, архивы почты), чего не наблюдалось с предыдущими версиями .
🏗️ Будущее агентов: от сложного программирования к простым промптам 58:57
Важным трендом Килпатрик считает упрощение ИИ-систем. Если раньше для создания сложных функций (например, аудио-обзоров в Notebook LM) требовался 14-этапный процесс с передачей данных между разными инстансами модели, то теперь это сокращено до 4 этапов .
Основные тезисы об агентах:
- Модели-агенты «из коробки»: Модели эволюционируют так, что скоро им не понадобится внешняя «обвязка» (scaffolding). Они будут нативно владеть инструментами поиска, выполнения кода и работы с памятью .
- Риск «сложных систем»: По мнению Логана, компании, построившие слишком сложные надстройки над слабыми моделями прошлого года, сейчас сталкиваются с необходимостью их демонтажа, так как современные модели справляются с задачами через простой промпт .
- Диффузионные языковые модели: Килпатрик выразил восторг по поводу новой парадигмы генерации текста (diffusion vs autoregressive). Эти модели работают невероятно быстро, позволяя генерировать интерфейсы (UI) буквально на лету, подстраиваясь под глаз человека .
🧠 AGI и человеческий фактор: почему люди все еще важны
Отвечая на вопрос о сроках достижения AGI, Логан предположил, что это будет не «момент выхода супер-модели», а «продуктовый опыт» . По его мнению, кто-то объединит умную модель, эффективную память и правильный интерфейс так, что у пользователя возникнет ощущение взаимодействия с AGI .
Несмотря на технологический оптимизм, Килпатрик сохраняет «человекоцентричный» взгляд на мир:
- Отказ от помощи ИИ: Логан признался, что пишет 95% своих писем и твитов самостоятельно, без помощи ИИ, так как дорожит своим уникальным тоном и агентностью .
- Ценность человеческого «предсказания следующего токена»: По словам гостя, в мире, переполненном ИИ-контентом, мысли и опыт живых людей становятся экспоненциально ценнее .
- Совет разработчикам: Чтобы получить доступ к закрытым программам Google AI (early access), Килпатрик предложил писать ему напрямую на почту (
lkilpatrick@google.com), подчеркнув важность личных отношений даже в эпоху алгоритмов .