# Стив Морин: «Nvidia — это пузырь, а Google — спящий гигант ИИ-гонки»

Источник: https://www.youtube.com/watch?v=xEbNfpVE_A8
Канал: 20VC (Harry Stebbings)
Опубликовано: 24.02.2025

---

В новом эпизоде подкаста 20VC эксперт по ИИ-инфраструктуре и бывший инженер Google Стив Морин делится радикальным взглядом на будущее индустрии искусственного интеллекта. Он объясняет, почему доминирование Nvidia может оказаться «пузырём», как DeepSeek изменил правила игры в пользу эффективности и почему Google обладает уникальным преимуществом, которого нет у OpenAI.

## 🛠 ZML и мир без привязки к «железу»
[[JUMP:01:00]]

Стив Морин представляет ZML — фреймворк для машинного обучения, который позволяет запускать любые модели на любом оборудовании без потери производительности [01:11]. По словам гостя, это решение находится на самом нижнем уровне инфраструктуры, обеспечивая гибкость в выборе между Nvidia, AMD или TPU.

Морин утверждает, что привычное понимание «модели» как набора весов уходит в прошлое. Вместо этого индустрия движется к «созвездиям бэкендов» [02:19]. Когда пользователь взаимодействует с ИИ, он фактически общается с API, который за кулисами переключается между различными специализированными моделями: например, переходит от LLM к диффузионной модели для генерации изображений [02:32].

Ключевые тезисы о гибкости инфраструктуры:

*   **Эффективность AMD:** Переход с Nvidia на AMD при работе с моделями уровня 70B может дать четырехкратное преимущество в стоимости [03:54].
*   **Связка PyTorch и CUDA:** Главным препятствием для отказа от Nvidia остается глубокая интеграция самого популярного фреймворка PyTorch с проприетарным ПО Nvidia (CUDA) [04:46].
*   **Искусственный дефицит:** Морин считает, что рынок Nvidia самоподдерживается: люди покупают эти чипы, потому что их легче перепродать, и используют их, потому что на них написан весь существующий код [06:09].

## 📉 Почему Nvidia — это пузырь, который может лопнуть
[[JUMP:06:30]]

Несмотря на текущие рыночные успехи Nvidia, Стив Морин выражает серьезные опасения относительно устойчивости их бизнес-модели. Он сравнивает финансовые модели поколений чипов A100 и H100 [07:13].

Аргументы гостя против доминирования Nvidia:

1.  **Разрыв в цене и производительности:** H100 стоит в пять раз дороже предшественника, но в задачах инференса (исполнения моделей) он быстрее всего в два раза [07:37].
2.  **Проблемы амортизации:** Компании строят планы амортизации на 6–7 лет, используя GPU в качестве залога, но реальная ценность этого оборудования может упасть быстрее, чем ожидается [08:06].
3.  **Переход к инференсу:** Сейчас рынок сфокусирован на обучении (training), но через 5 лет, по прогнозу Морина, 95% рынка будет занимать инференс [35:14].

Морин полагает, что Nvidia тратит огромные силы на то, чтобы заставить мир верить в незаменимость CUDA, хотя на самом деле это лишь «стечение обстоятельств» [36:50]. Он называет текущие наценки Nvidia в 90% «безумными» и считает, что ПО должно абстрагироваться от особенностей конкретного «железа», как это уже произошло в мире CPU [37:28].

## 🏗 Новая архитектура: агенты и рассуждения
[[JUMP:08:35]]

По мнению Стива Морина, настоящим вызовом для Nvidia станут ИИ-агенты и модели с функцией рассуждения (reasoning). В отличие от чат-ботов, где важна скорость появления каждого токена, для агентов критична общая задержка (latency) — время от начала запроса до финального результата [09:02].

Проблемы современных чипов в новых задачах:

*   **GPU не создавались для ИИ:** Исторически это чипы для рендеринга графики (матриц пикселей). Использование их для ИИ — это «удачный трюк», который начал давать сбои на масштабах LLM [11:25].
*   **Память как узкое место:** Передача данных из внешней памяти (HBM) в чип замедляет работу. Решения от Groq или Cerebras используют SRAM (память прямо на чипе), что дает колоссальную скорость, но стоит крайне дорого [28:35].
*   **Будущее за специализированными чипами:** Гость выделяет стартапы Etched и Vizzora как перспективных игроков, способных конкурировать с GPU по цене, предлагая архитектуру, заточенную под инференс [29:26].

## 🏆 Почему Google победит, а OpenAI — нет
[[JUMP:50:34]]

Стив Морин формулирует «треугольник победы» в гонке ИИ, состоящий из трех элементов:

1.  Продукты (интерфейсы взаимодействия с пользователем).
2.  Данные.
3.  Собственные вычислительные мощности (Compute).

По словам гостя, Google — единственная компания (наряду с Amazon в меньшей степени), обладающая всеми тремя компонентами [50:47]. Google имеет продукты (Android, Docs), данные и свои чипы TPU, которые Морин называет самыми зрелыми на рынке после Nvidia [44:12].

Ситуация с OpenAI выглядит иначе:

*   У OpenAI есть отличный продукт, но нет своих вычислений — они зависят от Microsoft [51:41].
*   Отсутствие контроля над инфраструктурой означает потерю маржи.
*   Google Морин называет «спящим гигантом», который может интегрировать ИИ во все свои сервисы одновременно [51:14].

## 🇨🇳 Феномен DeepSeek и уроки эффективности
[[JUMP:1:06:43]]

Успех китайской модели DeepSeek стал для индустрии «сигналом к пробуждению». Морин считает, что экспортные ограничения США стали для Китая «матерью инноваций» [1:06:56]. Не имея возможности просто купить больше мощностей, китайские инженеры были вынуждены сосредоточиться на эффективности.

Уроки DeepSeek по версии Морина:

*   **Ограничения порождают качество:** Если ты не можешь завалить проблему деньгами и чипами, ты пишешь лучший код [1:07:11].
*   **Демократизация:** География больше не имеет значения. Прорывные технологии могут появиться из ниоткуда и сразу изменить карту мира [1:07:38].
*   **Конец монолитов:** Индустрия может прийти к модели «автопроизводителей», где будет много сильных игроков с разными специализациями, а не один победитель, забирающий всё [1:08:47].

## 🚀 Будущее: World Models и отказ от трансформеров
[[JUMP:55:02]]

В долгосрочной перспективе Морин делает ставку на «модели мира» (World Models), концепцию которых продвигает Ян Лекун из Meta. LLM — это лишь узкое окно в мир через язык, который передает информацию с потерями [56:49].

Гость выделяет перспективные направления:

*   **JEPA (Joint Embedding Predictive Architecture):** Попытка заставить ИИ понимать физику и логику мира, минимизируя затраты энергии на переход от одного состояния к другому [57:03].
*   **Диффузионные LLM:** Вместо предсказания следующего токена (слога), эти модели генерируют текст «фрагментами», как это делает человеческий мозг [57:56].
*   **Отказ от обучения:** Специалисты DeepMind уже почти не занимаются тонкой настройкой (fine-tuning) моделей. Они просто «вбрасывают» данные в огромное контекстное окно модели во время работы [1:03:10].

Стив Морин критически относится к мега-проектам вроде Stargate (план Microsoft и OpenAI на $500 млрд). Он называет это «американским стилем» — попыткой грубой силой и вертикальным масштабированием решить проблему, которая требует инженерного изящества и эффективности [1:12:19]. «Это как огромный американский автомобиль: он большой, ест много бензина, но это не значит, что это хорошая машина», — резюмирует эксперт [1:12:34].