Мэтью Берман обсудил с Томасом Курианом стратегию Google в области вычислительных мощностей, конкуренцию с NVIDIA и Anthropic, а также будущее агентных систем. CEO Google Cloud утверждает, что компания преодолела дефицит вычислительных ресурсов за счет 12-летнего опыта разработки собственных чипов TPU и перехода от строительства дата-центров к их промышленному производству.
⚡️ Стратегия избыточных мощностей и TPU 0:42
В то время как OpenAI и Anthropic сталкиваются с ограничением вычислительных ресурсов, Google обладает избытком мощностей . Томас Куриан объясняет это долгосрочным планированием, которое началось более десяти лет назад. Google диверсифицировал источники энергии и закрепил за собой права на недвижимость для дата-центров задолго до пика спроса на нейросети .
Одним из ключевых факторов успеха Томас Куриан называет использование промышленных методов возведения инфраструктуры:
- Компания перешла от классического строительства (construction) к производству (manufacturing) дата-центров .
- Мощности развертываются не отдельными стойками, а целыми рядами предварительно протестированных систем, что радикально сокращает сроки запуска .
- Восьмое поколение TPU, анонсированное в 2024 году, позволяет Google не только обучать Gemini, но и продавать чипы как услугу внешним клиентам, таким как Citadel и Министерство энергетики США .
Google не планирует «придерживать» чипы только для себя. По словам Томаса Куриана, продажа мощностей сторонним лабораториям генерирует денежный поток, необходимый для финансирования дорогостоящих исследований в области AGI . При этом владение собственным кремнием (IP) обеспечивает Google высокую маржинальность и независимость от цен посредников .
🏗️ Эффективность и охлаждение инфраструктуры 8:02
На фоне негативного отношения общества к строительству дата-центров из-за нагрузки на электросети, Google внедряет технологии «за счетчиком» (behind the meter) . Это позволяет компании генерировать собственную энергию и даже отдавать излишки в сеть в периоды дефицита .
Особое внимание уделяется коэффициенту PUE (Power Usage Effectiveness). Томас Куриан заявляет, что Google достигла самых низких показателей в индустрии, минимизируя потери энергии на охлаждение . В частности, чип TPU 8i может работать без водяного охлаждения (в воздушном режиме), что позволяет размещать его в стандартных дата-центрах по всему миру для снижения задержек при инференсе .
🤖 От чат-ботов к агентам: эволюция архитектуры 24:32
Томас Куриан выделяет три этапа развития ИИ, которые напрямую влияют на дизайн чипов :
- Поиск и ответы: работа с текстом, где входных токенов больше, чем выходных.
- Генерация контента: мультимодальный вывод (видео, аудио, изображения), требующий огромного объема выходных токенов .
- Агенты: системы, выполняющие задачи годами. Здесь критически важен объем памяти (KV-кэш) для удержания контекста в течение 6–12 часов работы без дорогостоящего перемещения токенов .
Система TPU 8T способна объединять в одном поде до 2 петабайт памяти, что в 100 раз превышает объем оцифрованной Библиотеки Конгресса . Такая архитектура необходима для работы с «Mythos-подобными» моделями. Хотя Томас Куриан не подтвердил слухи о модели с 10 триллионами параметров, он заверил, что Google уже обладает стеком Serving Disaggregated, способным эффективно обслуживать модели такого масштаба .
💻 Будущее программирования и кибербезопасность 41:42
Внутри Google инженеры используют Jet Ski — внутреннюю среду для агентного написания кода . Томас Куриан признает, что отрасль рискует потерять глубокое понимание кода, если полагаться только на промпты . Однако Google внедряет ИИ-инспекцию для проверки качества и безопасности, где нейросеть сканирует код на уязвимости перед тем, как его увидит старший инженер .
В вопросе кибербезопасности Google занимает наступательную позицию:
- Созданы агенты для «непрерывного редтиминга» (аттакующие агенты), которые постоянно ищут дыры в защите .
- Модели обучаются не только находить, но и автоматически исправлять (патчить) уязвимости, что критически важно для защиты открытого ПО .
🤝 Конкуренция с Anthropic и партнерство с Apple 35:01
Мэтью Берман поднял вопрос о странном положении Anthropic: компания является прямым конкурентом Google в сфере LLM (модели Claude), но при этом использует инфраструктуру Google Cloud для обучения . Томас Куриан сравнил это со стратегией AWS: быть платформой важнее, чем играть в фаворитизм . Это же касается и Apple Intelligence, где Google выступает поставщиком моделей, несмотря на конкуренцию Android и iOS .
По данным на апрель 2026 года, количество токенов, обрабатываемых в Gemini Enterprise, выросло с 10 до 16 миллиардов в минуту за три месяца . Число корпоративных пользователей платформы увеличилось на 40% за квартал .