Стив Морин: «Nvidia — это пузырь, а Google — спящий гигант ИИ-гонки»

В новом эпизоде подкаста 20VC эксперт по ИИ-инфраструктуре и бывший инженер Google Стив Морин делится радикальным взглядом на будущее индустрии искусственного интеллекта. Он объясняет, почему доминирование Nvidia может оказаться «пузырём», как DeepSeek изменил правила игры в пользу эффективности и почему Google обладает уникальным преимуществом, которого нет у OpenAI.

🛠 ZML и мир без привязки к «железу» 1:00

Стив Морин представляет ZML — фреймворк для машинного обучения, который позволяет запускать любые модели на любом оборудовании без потери производительности . По словам гостя, это решение находится на самом нижнем уровне инфраструктуры, обеспечивая гибкость в выборе между Nvidia, AMD или TPU.

Морин утверждает, что привычное понимание «модели» как набора весов уходит в прошлое. Вместо этого индустрия движется к «созвездиям бэкендов» . Когда пользователь взаимодействует с ИИ, он фактически общается с API, который за кулисами переключается между различными специализированными моделями: например, переходит от LLM к диффузионной модели для генерации изображений .

Ключевые тезисы о гибкости инфраструктуры:

Эффективность AMD: Переход с Nvidia на AMD при работе с моделями уровня 70B может дать четырехкратное преимущество в стоимости .
Связка PyTorch и CUDA: Главным препятствием для отказа от Nvidia остается глубокая интеграция самого популярного фреймворка PyTorch с проприетарным ПО Nvidia (CUDA) .
Искусственный дефицит: Морин считает, что рынок Nvidia самоподдерживается: люди покупают эти чипы, потому что их легче перепродать, и используют их, потому что на них написан весь существующий код .

📉 Почему Nvidia — это пузырь, который может лопнуть 6:30

Несмотря на текущие рыночные успехи Nvidia, Стив Морин выражает серьезные опасения относительно устойчивости их бизнес-модели. Он сравнивает финансовые модели поколений чипов A100 и H100 .

Аргументы гостя против доминирования Nvidia:

Разрыв в цене и производительности: H100 стоит в пять раз дороже предшественника, но в задачах инференса (исполнения моделей) он быстрее всего в два раза .
Проблемы амортизации: Компании строят планы амортизации на 6–7 лет, используя GPU в качестве залога, но реальная ценность этого оборудования может упасть быстрее, чем ожидается .
Переход к инференсу: Сейчас рынок сфокусирован на обучении (training), но через 5 лет, по прогнозу Морина, 95% рынка будет занимать инференс .

Морин полагает, что Nvidia тратит огромные силы на то, чтобы заставить мир верить в незаменимость CUDA, хотя на самом деле это лишь «стечение обстоятельств» . Он называет текущие наценки Nvidia в 90% «безумными» и считает, что ПО должно абстрагироваться от особенностей конкретного «железа», как это уже произошло в мире CPU .

🏗 Новая архитектура: агенты и рассуждения 8:35

По мнению Стива Морина, настоящим вызовом для Nvidia станут ИИ-агенты и модели с функцией рассуждения (reasoning). В отличие от чат-ботов, где важна скорость появления каждого токена, для агентов критична общая задержка (latency) — время от начала запроса до финального результата .

Проблемы современных чипов в новых задачах:

GPU не создавались для ИИ: Исторически это чипы для рендеринга графики (матриц пикселей). Использование их для ИИ — это «удачный трюк», который начал давать сбои на масштабах LLM .
Память как узкое место: Передача данных из внешней памяти (HBM) в чип замедляет работу. Решения от Groq или Cerebras используют SRAM (память прямо на чипе), что дает колоссальную скорость, но стоит крайне дорого .
Будущее за специализированными чипами: Гость выделяет стартапы Etched и Vizzora как перспективных игроков, способных конкурировать с GPU по цене, предлагая архитектуру, заточенную под инференс .

🏆 Почему Google победит, а OpenAI — нет 50:34

Стив Морин формулирует «треугольник победы» в гонке ИИ, состоящий из трех элементов:

Продукты (интерфейсы взаимодействия с пользователем).
Данные.
Собственные вычислительные мощности (Compute).

По словам гостя, Google — единственная компания (наряду с Amazon в меньшей степени), обладающая всеми тремя компонентами . Google имеет продукты (Android, Docs), данные и свои чипы TPU, которые Морин называет самыми зрелыми на рынке после Nvidia .

Ситуация с OpenAI выглядит иначе:

У OpenAI есть отличный продукт, но нет своих вычислений — они зависят от Microsoft .
Отсутствие контроля над инфраструктурой означает потерю маржи.
Google Морин называет «спящим гигантом», который может интегрировать ИИ во все свои сервисы одновременно .

🇨🇳 Феномен DeepSeek и уроки эффективности 1:06:43

Успех китайской модели DeepSeek стал для индустрии «сигналом к пробуждению». Морин считает, что экспортные ограничения США стали для Китая «матерью инноваций» . Не имея возможности просто купить больше мощностей, китайские инженеры были вынуждены сосредоточиться на эффективности.

Уроки DeepSeek по версии Морина:

Ограничения порождают качество: Если ты не можешь завалить проблему деньгами и чипами, ты пишешь лучший код .
Демократизация: География больше не имеет значения. Прорывные технологии могут появиться из ниоткуда и сразу изменить карту мира .
Конец монолитов: Индустрия может прийти к модели «автопроизводителей», где будет много сильных игроков с разными специализациями, а не один победитель, забирающий всё .

🚀 Будущее: World Models и отказ от трансформеров 55:02

В долгосрочной перспективе Морин делает ставку на «модели мира» (World Models), концепцию которых продвигает Ян Лекун из Meta. LLM — это лишь узкое окно в мир через язык, который передает информацию с потерями .

Гость выделяет перспективные направления:

JEPA (Joint Embedding Predictive Architecture): Попытка заставить ИИ понимать физику и логику мира, минимизируя затраты энергии на переход от одного состояния к другому .
Диффузионные LLM: Вместо предсказания следующего токена (слога), эти модели генерируют текст «фрагментами», как это делает человеческий мозг .
Отказ от обучения: Специалисты DeepMind уже почти не занимаются тонкой настройкой (fine-tuning) моделей. Они просто «вбрасывают» данные в огромное контекстное окно модели во время работы .

Стив Морин критически относится к мега-проектам вроде Stargate (план Microsoft и OpenAI на $500 млрд). Он называет это «американским стилем» — попыткой грубой силой и вертикальным масштабированием решить проблему, которая требует инженерного изящества и эффективности . «Это как огромный американский автомобиль: он большой, ест много бензина, но это не значит, что это хорошая машина», — резюмирует эксперт .