Инфраструктура снова сексуальна: Как Google и Cisco строят реальный фундамент для ИИ

a16z (Andreessen Horowitz) 18,7 тыс. 32 мин 6 мин 29.10.2025
Главное

Инфраструктура снова стала «сексуальной». То, что происходит сегодня в сфере строительства мощностей для искусственного интеллекта, участники дискуссии сравнивают одновременно с экспансией интернета 90-х, космической гонкой и Манхэттенским проектом. Масштаб текущих инвестиций и физического строительства не просто впечатляет — по оценкам экспертов, он в 100 раз превышает темпы развития сети времен доткомов, неся в себе глубокие геополитические и экономические последствия.

🏗️ Инфраструктурный бум: масштаб Манхэттенского проекта 0:00

По мнению Джонатана Дэвидсона, современный цикл развития ИТ-инфраструктуры уникален: в нем соединились вопросы национальной безопасности, геополитики и беспрецедентной экономической целесообразности . Мартин Касадо отмечает, что если раньше создание «железа» считалось чем-то второстепенным по сравнению с софтом, то теперь это — передовая линия технологий .

Амин Вахдат подчеркивает колоссальный разрыв в масштабах: если интернет-бум конца 90-х казался огромным, то нынешний ИИ-цикл превосходит его в 100 раз . Несмотря на опасения некоторых аналитиков о возникновении «пузыря», Джонатан Дэвидсон считает, что рынок, напротив, недооценивает реальные потребности . Согласно его прогнозу, для обеспечения ИИ-мощностей потребуется гораздо больше ресурсов, чем заложено в текущих прогнозах.

Основные характеристики текущего цикла:

⚡ Ограничения роста: дефицит энергии и «чеки, которые нельзя обналичить» 3:55

Амин Вахдат из Google утверждает, что индустрия находится лишь в самом начале цикла капитальных затрат (CapEx) . Спрос на вычислительные мощности настолько велик, что даже специализированные чипы TPU (Tensor Processing Unit) семилетней давности до сих пор загружены на 100% . Google вынуждена отказывать многим внутренним и внешним клиентам просто из-за отсутствия свободных мощностей.

Однако на пути этого роста стоят жесткие физические ограничения. По мнению Вахдата, главным сдерживающим фактором стала не нехватка денег, а дефицит электроэнергии, земли и сложности в цепочках поставок . Он высказал скептическую мысль: хотя компании готовы тратить триллионы долларов, они физически не смогут «обналичить эти чеки», так как инфраструктура не строится так быстро, как печатаются деньги .

Джонатан Дэвидсон добавляет, что из-за дефицита энергии архитектура облаков меняется:

🖥️ Возвращение мейнфреймов или новая эра систем? 8:10

Мартин Касадо задал вопрос о том, не возвращаемся ли мы к эпохе мейнфреймов, учитывая, что NVIDIA фактически предлагает гигантские монолитные суперкомпьютеры . Амин Вахдат не согласен с этой аналогией. Он считает, что мы по-прежнему находимся в эре горизонтально масштабируемых систем (scale-out), но на новом уровне абстракции .

По прогнозу Вахдата, через пять лет современный стек технологий будет неузнаваем . Ключевым трендом станет «совместное проектирование» (co-design) аппаратного и программного обеспечения. В качестве примера из истории Google он привел такие системы, как Bigtable и Spanner, которые создавались одновременно с серверным «железом» .

Джонатан Дэвидсон подчеркивает критическую важность интеграции:

  1. Эффективность системы теперь измеряется отсутствием потерь при передаче данных от физического уровня (кремния) до семантического (приложения) .
  2. Индустрия должна работать как «единая компания», создавая открытые экосистемы вместо закрытых «садов» (walled gardens), чтобы избежать монополизации .

🧪 Золотой век специализированных процессоров 11:50

Обсуждая доминирование NVIDIA, Амин Вахдат отметил, что Google является большим фанатом их продуктов, но будущее — за специализацией . Он называет текущий момент «золотым веком специализации». По его словам, TPU для определенных задач в 10–100 раз эффективнее на ватт потребляемой мощности, чем универсальные процессоры (CPU) .

Однако у специализации есть цена — время. По оценке Вахдата, цикл от концепции до запуска чипа в производство сегодня составляет минимум 2,5 года, даже для лучших команд мира . Это создает риск: к моменту выхода «железа» задачи могут измениться.

Геополитический аспект специализации, по мнению Дэвидсона:

🌐 Сеть как «множитель силы» 15:37

Джонатан Дэвидсон утверждает, что если энергия — это ограничение, а вычисления — актив, то сеть — это множитель силы . Каждый сэкономленный на передаче данных киловатт можно отдать графическому процессору (GPU) для вычислений .

Амин Вахдат указывает на уникальную проблему ИИ-нагрузок — их «взрывной» характер (burstiness). Энергосети буквально замечают моменты, когда тысячи чипов одновременно прекращают вычисления и начинают обмениваться данными по сети . Это создает колоссальные перепады потребления мощностей в сотни мегаватт.

Спикеры выделили два типа сетевой оптимизации:

Дэвидсон также затронул тему рыночной конкуренции, отметив, что Cisco стремится предоставить альтернативу чипам Broadcom, чтобы избежать «хищнической монополии» в сетевом сегменте .

📉 Экономика инференса: дешевле, но не для пользователя 20:45

Стоимость инференса (работы уже обученной модели) демонстрирует впечатляющее снижение — в 10–100 раз . Однако, по словам Вахдата, пользователи этого не замечают. Как только инженерам удается снизить стоимость единицы вычислений, выходят новые, более сложные модели, которые потребляют еще больше ресурсов для обеспечения более высокого качества .

В результате «цена за интеллект» падает, но общие затраты компаний на ИИ продолжают расти из-за неутолимого спроса на качество ответов и скорость рассуждений (reasoning) .

💻 Внутренняя кухня: ИИ в Google и Cisco 23:37

Участники поделились опытом внедрения ИИ внутри своих корпораций. Google использует ИИ для радикального ускорения миграции кода. Амин Вахдат рассказал историю о проекте перехода с базы данных Bigtable на Spanner: предварительная оценка трудозатрат составила «7 человеко-тысячелетий» (staff millennia) . В итоге от миграции тогда отказались, решив, что Bigtable «будет жить вечно». Сегодня ИИ позволяет проводить подобные трансформации кодовой базы (например, перенос с x86 на ARM) гораздо быстрее .

Опыт Cisco показывает аналогичные результаты:

Джонатан Дэвидсон подчеркивает необходимость «культурного сброса»: инженерам нельзя откладывать ИИ-инструменты в сторону, если они не сработали сегодня. Нужно возвращаться к ним каждые 4 недели, так как прогресс идет слишком быстро .

🔮 Советы фаундерам и взгляд в будущее 28:50

В завершение дискуссии спикеры дали советы основателям стартапов:

  1. Избегайте «тонких оберток»: По мнению Дэвидсона, компании, которые просто создают интерфейс поверх чужих моделей без глубокой интеграции в продукт, не будут долговечными .
  2. Фокус на агентах: В ближайшие 12 месяцев произойдет переход от простых чат-ботов к автономным агентам, способным выполнять длинные цепочки действий .
  3. Мультимодальность как стандарт: Амин Вахдат прогнозирует, что работа с видео и изображениями станет такой же привычной и эффективной для продуктивности, как сегодня работа с текстом .

Мартин Касадо резюмировал, что инфраструктура перестала быть просто «подвалом» ИТ-индустрии, превратившись в её самый динамичный и стратегически важный сектор.

💬 Цитаты

«Это комбинация строительства интернета, космической гонки и Манхэттенского проекта в одном флаконе.»

Джонатан Дэвидсон 02:41

«Я не уверен, что мы сможем обналичить все эти чеки. У вас есть деньги, но вы не можете потратить их так быстро, как хотите.»

Амин Вахдат 05:18

«Если вы просто обертка вокруг моделей других людей, долговечность вашего бизнеса будет очень короткой.»

Джонатан Дэвидсон 30:05
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
TPU (Tensor Processing Unit)
Специализированные ускорители от Google, разработанные специально для задач машинного обучения.
Инференс (Inference)
Процесс использования уже обученной ИИ-модели для получения предсказаний или ответов на запросы.
Scale-out
Горизонтальное масштабирование системы путем добавления новых узлов (серверов) в кластер.
CapEx (Capital Expenditure)
Капитальные затраты компании на приобретение или модернизацию физических активов, таких как оборудование или здания.
📊 Цифры
🗓 Хронология
  1. 10 лет назад Google начала разработку и использование собственных чипов TPU.
  2. 2024 Текущий момент: инфраструктура становится главным приоритетом CapEx-затрат техгигантов.
  3. Следующие 12 месяцев Ожидаемый прорыв в области мультимодальных моделей (видео/изображения) и ИИ-агентов.
⚖️ Другая сторона
Технологии и IT Google Cisco TPU GPU Амин Вахдат