В секретных лабораториях Google в Силиконовой долине создаются технологии, которые определяют облик современного искусственного интеллекта. Речь идёт не только о чат-ботах, но и о «железе», на котором они работают: кастомных чипах TPU (Tensor Processing Units). Сегодня эти процессоры обеспечивают работу поиска, YouTube и нейросети Gemini, а недавно стало известно, что даже Apple использует вычислительные мощности Google для обучения своих моделей ИИ.
🛠 Рождение TPU: От голосового поиска до суперкомпьютеров 0:02
История собственных чипов Google началась в 2014 году из-за простой математической задачи. Группа инженеров подсчитала: если каждый пользователь Google будет использовать голосовой поиск хотя бы 30 секунд в день, компании придется удвоить количество серверов в своих дата-центрах .
Как вспоминает Амин Вахдат, глава подразделения кастомных чипов Google Cloud, перед компанией встал выбор: покупать тысячи универсальных процессоров или создать что-то своё . В итоге Google разработала TPU — специализированные интегральные схемы (ASIC), предназначенные исключительно для задач машинного обучения.
Ключевые преимущества первой разработки:
- Эффективность: TPU оказались в 100 раз эффективнее универсальных чипов для конкретных ИИ-задач .
- Масштабируемость: Новейшая система Trillium объединяет 256 чипов в одну стойку, работающую как единый суперкомпьютер .
- Специализация: В отличие от универсальных CPU от Intel или AMD, TPU заточены под тензорные вычисления, лежащие в основе нейросетей .
Помимо TPU, Google выпускает и другие специализированные решения: VCU (Video Coding Units) для обработки видео на YouTube и чипы серии G для смартфонов Pixel .
🏆 Доминирование на рынке и конкуренция с Nvidia 4:16
Хотя Nvidia сегодня считается безусловным лидером индустрии ИИ с капитализацией более $3 трлн, Google выбрала иной путь, начав разрабатывать собственные чипы задолго до «бума» генеративного ИИ .
По данным аналитиков, на которые ссылается CNBC, Google занимает 58% рынка кастомных облачных ИИ-чипов . Для сравнения:
- Google (TPU): 58% рынка.
- Amazon (Inferentia/Trainium): 21% рынка.
- Microsoft (Maia): Анонсирован только в конце 2023 года.
По мнению ведущей CNBC, именно наличие собственных чипов позволило Google Cloud подняться в глазах индустрии и встать в один ряд с лидерами облачных вычислений . Однако эксперты отмечают и слабую сторону: кастомные чипы Google менее гибкие и программируемые, чем платформы Nvidia . Тем не менее, как считает Амин Вахдат, доступность TPU позволила исследователям Google в 2017 году изобрести архитектуру Transformer — фундамент всех современных LLM .
🍎 Секретный контракт с Apple и обучение Gemini 5:46
Несмотря на конкуренцию, Google успешно монетизирует свои чипы, сдавая их в аренду другим технологическим гигантам. Недавний технический документ Apple раскрыл, что компания использовала инфраструктуру Google для обучения своих моделей Apple Intelligence .
Факты об использовании TPU:
- Apple: Арендовала мощности Google (по цене около $2 за чип в час), чтобы не зависеть исключительно от дефицитных поставок Nvidia .
- Gemini: Флагманская модель Google была полностью обучена и работает на базе TPU .
- Внешние клиенты: Среди пользователей мощностей Google значатся Deutsche Bank, Estée Lauder и McDonald’s .
С 2018 года Google сделала свои чипы доступными для третьих лиц через облако, что позволило компаниям выбирать между дорогой Nvidia и более специализированным «железом» от Google .
⚙️ Технологическое партнёрство и геополитические риски 7:44
Создание таких сложных устройств, как TPU, невозможно в одиночку. Google сотрудничает с Broadcom — партнёром, который помогает в проектировании периферийных систем чипа . Broadcom инвестировала более $3 млрд в исследования и разработки для поддержки подобных партнёрств .
Производство самих кристаллов сосредоточено на заводах TSMC в Тайване, что создаёт определённые риски. На вопрос об угрозе со стороны Китая Амин Вахдат ответил, что компания готовится к различным сценариям, но признал: если с Тайванем что-то случится, это отбросит назад не только Google, но и весь мир .
США пытаются диверсифицировать производство через Chips Act, выделяя $52 млрд на строительство заводов (Fabs) внутри страны, включая проекты Intel, TSMC и Samsung .
⚡️ Энергоэффективность и новый процессор Axion 9:43
В 2024 году Google сделала следующий шаг, представив Axion — свой первый универсальный процессор на базе архитектуры ARM . Это ответ на чипы Graviton от Amazon, которые присутствуют на рынке с 2018 года .
Зачем Google свой CPU?
- Вертикальная интеграция: Полный контроль над стеком технологий.
- Энергоэффективность: Ожидается, что к 2027 году ИИ-серверы будут потреблять столько же энергии, сколько небольшая страна .
- Снижение затрат: Собственное «железо» позволяет снизить операционные расходы облака.
Проблема энергопотребления стоит остро: выбросы углекислого газа Google выросли на 50% с 2019 года из-за роста дата-центров . Чтобы справиться с перегревом, Google внедрила систему жидкостного охлаждения (direct-to-chip cooling), которая гораздо эффективнее традиционного водяного охлаждения и используется в новейших стойках TPU .
Амин Вахдат заключает, что индустрия ИИ сейчас находится на этапе, который невозможно было предсказать ещё 5 лет назад, и аппаратное обеспечение будет играть в этом развитии ключевую роль .