Томас Куриан: «Владеть своими чипами лучше, чем перепродавать чужие»

Matthew Berman 40,6 тыс. 53 мин 3 мин 24.04.2026
Главное

Мэтью Берман обсудил с Томасом Курианом стратегию Google в области вычислительных мощностей, конкуренцию с NVIDIA и Anthropic, а также будущее агентных систем. CEO Google Cloud утверждает, что компания преодолела дефицит вычислительных ресурсов за счет 12-летнего опыта разработки собственных чипов TPU и перехода от строительства дата-центров к их промышленному производству.

⚡️ Стратегия избыточных мощностей и TPU 0:42

В то время как OpenAI и Anthropic сталкиваются с ограничением вычислительных ресурсов, Google обладает избытком мощностей . Томас Куриан объясняет это долгосрочным планированием, которое началось более десяти лет назад. Google диверсифицировал источники энергии и закрепил за собой права на недвижимость для дата-центров задолго до пика спроса на нейросети .

Одним из ключевых факторов успеха Томас Куриан называет использование промышленных методов возведения инфраструктуры:

Google не планирует «придерживать» чипы только для себя. По словам Томаса Куриана, продажа мощностей сторонним лабораториям генерирует денежный поток, необходимый для финансирования дорогостоящих исследований в области AGI . При этом владение собственным кремнием (IP) обеспечивает Google высокую маржинальность и независимость от цен посредников .

🏗️ Эффективность и охлаждение инфраструктуры 8:02

На фоне негативного отношения общества к строительству дата-центров из-за нагрузки на электросети, Google внедряет технологии «за счетчиком» (behind the meter) . Это позволяет компании генерировать собственную энергию и даже отдавать излишки в сеть в периоды дефицита .

Особое внимание уделяется коэффициенту PUE (Power Usage Effectiveness). Томас Куриан заявляет, что Google достигла самых низких показателей в индустрии, минимизируя потери энергии на охлаждение . В частности, чип TPU 8i может работать без водяного охлаждения (в воздушном режиме), что позволяет размещать его в стандартных дата-центрах по всему миру для снижения задержек при инференсе .

🤖 От чат-ботов к агентам: эволюция архитектуры 24:32

Томас Куриан выделяет три этапа развития ИИ, которые напрямую влияют на дизайн чипов :

  1. Поиск и ответы: работа с текстом, где входных токенов больше, чем выходных.
  2. Генерация контента: мультимодальный вывод (видео, аудио, изображения), требующий огромного объема выходных токенов .
  3. Агенты: системы, выполняющие задачи годами. Здесь критически важен объем памяти (KV-кэш) для удержания контекста в течение 6–12 часов работы без дорогостоящего перемещения токенов .

Система TPU 8T способна объединять в одном поде до 2 петабайт памяти, что в 100 раз превышает объем оцифрованной Библиотеки Конгресса . Такая архитектура необходима для работы с «Mythos-подобными» моделями. Хотя Томас Куриан не подтвердил слухи о модели с 10 триллионами параметров, он заверил, что Google уже обладает стеком Serving Disaggregated, способным эффективно обслуживать модели такого масштаба .

💻 Будущее программирования и кибербезопасность 41:42

Внутри Google инженеры используют Jet Ski — внутреннюю среду для агентного написания кода . Томас Куриан признает, что отрасль рискует потерять глубокое понимание кода, если полагаться только на промпты . Однако Google внедряет ИИ-инспекцию для проверки качества и безопасности, где нейросеть сканирует код на уязвимости перед тем, как его увидит старший инженер .

В вопросе кибербезопасности Google занимает наступательную позицию:

🤝 Конкуренция с Anthropic и партнерство с Apple 35:01

Мэтью Берман поднял вопрос о странном положении Anthropic: компания является прямым конкурентом Google в сфере LLM (модели Claude), но при этом использует инфраструктуру Google Cloud для обучения . Томас Куриан сравнил это со стратегией AWS: быть платформой важнее, чем играть в фаворитизм . Это же касается и Apple Intelligence, где Google выступает поставщиком моделей, несмотря на конкуренцию Android и iOS .

По данным на апрель 2026 года, количество токенов, обрабатываемых в Gemini Enterprise, выросло с 10 до 16 миллиардов в минуту за три месяца . Число корпоративных пользователей платформы увеличилось на 40% за квартал .

💬 Цитаты

«Лучше иметь собственные чипы и спрос, чем не иметь собственных чипов.»

Томас Куриан 37:46

«Manufacturing всегда работает быстрее, чем строительство (construction).»

Томас Куриан 02:16

«Самый сложный компьютер в мире — это облако. На его фоне ПК выглядит как игрушка.»

Томас Куриан 44:52
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
TPU
Tensor Processing Unit — специализированный чип от Google, оптимизированный для задач машинного обучения.
PUE
Power Usage Effectiveness — коэффициент эффективности использования энергии в дата-центре.
KV-кэш
Механизм хранения промежуточных данных внимания в трансформерных моделях для ускорения генерации текста.
Jet Ski
Внутренний инструмент Google для автоматизации написания и проверки кода с помощью ИИ.
📊 Цифры
🗓 Хронология
  1. 2014 Начало активной разработки собственных чипов TPU в Google.
  2. 2024 Анонс 8-го поколения TPU (8T и 8i) и разделение линеек для обучения и инференса.
  3. Апрель 2026 Запись интервью, объем генерации Gemini достигает 16 млрд токенов в минуту.
⚖️ Другая сторона
Искусственный интеллект Thomas Kurian Google Cloud TPU Gemini Anthropic