Google против Nvidia: Как TPU захватили 58% рынка кастомных ИИ-чипов

CNBC 824 тыс. 13 мин 4 мин 23.08.2024
Главное

В секретных лабораториях Google в Силиконовой долине создаются технологии, которые определяют облик современного искусственного интеллекта. Речь идёт не только о чат-ботах, но и о «железе», на котором они работают: кастомных чипах TPU (Tensor Processing Units). Сегодня эти процессоры обеспечивают работу поиска, YouTube и нейросети Gemini, а недавно стало известно, что даже Apple использует вычислительные мощности Google для обучения своих моделей ИИ.

🛠 Рождение TPU: От голосового поиска до суперкомпьютеров 0:02

История собственных чипов Google началась в 2014 году из-за простой математической задачи. Группа инженеров подсчитала: если каждый пользователь Google будет использовать голосовой поиск хотя бы 30 секунд в день, компании придется удвоить количество серверов в своих дата-центрах .

Как вспоминает Амин Вахдат, глава подразделения кастомных чипов Google Cloud, перед компанией встал выбор: покупать тысячи универсальных процессоров или создать что-то своё . В итоге Google разработала TPU — специализированные интегральные схемы (ASIC), предназначенные исключительно для задач машинного обучения.

Ключевые преимущества первой разработки:

Помимо TPU, Google выпускает и другие специализированные решения: VCU (Video Coding Units) для обработки видео на YouTube и чипы серии G для смартфонов Pixel .

🏆 Доминирование на рынке и конкуренция с Nvidia 4:16

Хотя Nvidia сегодня считается безусловным лидером индустрии ИИ с капитализацией более $3 трлн, Google выбрала иной путь, начав разрабатывать собственные чипы задолго до «бума» генеративного ИИ .

По данным аналитиков, на которые ссылается CNBC, Google занимает 58% рынка кастомных облачных ИИ-чипов . Для сравнения:

По мнению ведущей CNBC, именно наличие собственных чипов позволило Google Cloud подняться в глазах индустрии и встать в один ряд с лидерами облачных вычислений . Однако эксперты отмечают и слабую сторону: кастомные чипы Google менее гибкие и программируемые, чем платформы Nvidia . Тем не менее, как считает Амин Вахдат, доступность TPU позволила исследователям Google в 2017 году изобрести архитектуру Transformer — фундамент всех современных LLM .

🍎 Секретный контракт с Apple и обучение Gemini 5:46

Несмотря на конкуренцию, Google успешно монетизирует свои чипы, сдавая их в аренду другим технологическим гигантам. Недавний технический документ Apple раскрыл, что компания использовала инфраструктуру Google для обучения своих моделей Apple Intelligence .

Факты об использовании TPU:

С 2018 года Google сделала свои чипы доступными для третьих лиц через облако, что позволило компаниям выбирать между дорогой Nvidia и более специализированным «железом» от Google .

⚙️ Технологическое партнёрство и геополитические риски 7:44

Создание таких сложных устройств, как TPU, невозможно в одиночку. Google сотрудничает с Broadcom — партнёром, который помогает в проектировании периферийных систем чипа . Broadcom инвестировала более $3 млрд в исследования и разработки для поддержки подобных партнёрств .

Производство самих кристаллов сосредоточено на заводах TSMC в Тайване, что создаёт определённые риски. На вопрос об угрозе со стороны Китая Амин Вахдат ответил, что компания готовится к различным сценариям, но признал: если с Тайванем что-то случится, это отбросит назад не только Google, но и весь мир .

США пытаются диверсифицировать производство через Chips Act, выделяя $52 млрд на строительство заводов (Fabs) внутри страны, включая проекты Intel, TSMC и Samsung .

⚡️ Энергоэффективность и новый процессор Axion 9:43

В 2024 году Google сделала следующий шаг, представив Axion — свой первый универсальный процессор на базе архитектуры ARM . Это ответ на чипы Graviton от Amazon, которые присутствуют на рынке с 2018 года .

Зачем Google свой CPU?

  1. Вертикальная интеграция: Полный контроль над стеком технологий.
  2. Энергоэффективность: Ожидается, что к 2027 году ИИ-серверы будут потреблять столько же энергии, сколько небольшая страна .
  3. Снижение затрат: Собственное «железо» позволяет снизить операционные расходы облака.

Проблема энергопотребления стоит остро: выбросы углекислого газа Google выросли на 50% с 2019 года из-за роста дата-центров . Чтобы справиться с перегревом, Google внедрила систему жидкостного охлаждения (direct-to-chip cooling), которая гораздо эффективнее традиционного водяного охлаждения и используется в новейших стойках TPU .

Амин Вахдат заключает, что индустрия ИИ сейчас находится на этапе, который невозможно было предсказать ещё 5 лет назад, и аппаратное обеспечение будет играть в этом развитии ключевую роль .

💬 Цитаты

«Если бы мы жили в мире, где всё должно было работать на процессорах общего назначения, возможно, никто бы даже не вообразил алгоритм Transformer.»

Амин Вахдат 05:20

«Тайвань — это риск не только для Google или Nvidia, это риск для всего мира.»

Амин Вахдат 09:03

«Мы создали TPU, чтобы решать задачи в 100 раз эффективнее, чем это было бы возможно на обычном железе.»

Амин Вахдат 02:32
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
TPU (Tensor Processing Unit)
Специализированный чип, разработанный Google специально для ускорения задач машинного обучения.
ASIC
Интегральная схема, созданная для решения конкретной узкой задачи, в отличие от процессоров общего назначения.
Trillium
Кодовое название последнего, шестого поколения TPU от Google.
Axion
Первый кастомный CPU от Google на базе архитектуры ARM для облачных вычислений.
📊 Цифры
🗓 Хронология
  1. 2014 Google принимает решение о разработке собственных чипов для голосового поиска.
  2. 2015 Запуск первого поколения TPU.
  3. 2017 Исследователи Google публикуют статью об архитектуре Transformer.
  4. 2018 TPU становятся доступны для сторонних клиентов облака Google.
  5. 2024 Анонс процессора Axion и раскрытие информации об использовании TPU компанией Apple.
⚖️ Другая сторона
Технологии и IT Google Cloud Tensor Processing Unit Apple Intelligence Broadcom Gemini