Стив Морин: «Nvidia — это пузырь, а Google — спящий гигант ИИ-гонки»

20VC (Harry Stebbings) 11,8 тыс. 1 ч 18 мин 5 мин 24.02.2025
Главное

В новом эпизоде подкаста 20VC эксперт по ИИ-инфраструктуре и бывший инженер Google Стив Морин делится радикальным взглядом на будущее индустрии искусственного интеллекта. Он объясняет, почему доминирование Nvidia может оказаться «пузырём», как DeepSeek изменил правила игры в пользу эффективности и почему Google обладает уникальным преимуществом, которого нет у OpenAI.

🛠 ZML и мир без привязки к «железу» 1:00

Стив Морин представляет ZML — фреймворк для машинного обучения, который позволяет запускать любые модели на любом оборудовании без потери производительности . По словам гостя, это решение находится на самом нижнем уровне инфраструктуры, обеспечивая гибкость в выборе между Nvidia, AMD или TPU.

Морин утверждает, что привычное понимание «модели» как набора весов уходит в прошлое. Вместо этого индустрия движется к «созвездиям бэкендов» . Когда пользователь взаимодействует с ИИ, он фактически общается с API, который за кулисами переключается между различными специализированными моделями: например, переходит от LLM к диффузионной модели для генерации изображений .

Ключевые тезисы о гибкости инфраструктуры:

📉 Почему Nvidia — это пузырь, который может лопнуть 6:30

Несмотря на текущие рыночные успехи Nvidia, Стив Морин выражает серьезные опасения относительно устойчивости их бизнес-модели. Он сравнивает финансовые модели поколений чипов A100 и H100 .

Аргументы гостя против доминирования Nvidia:

  1. Разрыв в цене и производительности: H100 стоит в пять раз дороже предшественника, но в задачах инференса (исполнения моделей) он быстрее всего в два раза .
  2. Проблемы амортизации: Компании строят планы амортизации на 6–7 лет, используя GPU в качестве залога, но реальная ценность этого оборудования может упасть быстрее, чем ожидается .
  3. Переход к инференсу: Сейчас рынок сфокусирован на обучении (training), но через 5 лет, по прогнозу Морина, 95% рынка будет занимать инференс .

Морин полагает, что Nvidia тратит огромные силы на то, чтобы заставить мир верить в незаменимость CUDA, хотя на самом деле это лишь «стечение обстоятельств» . Он называет текущие наценки Nvidia в 90% «безумными» и считает, что ПО должно абстрагироваться от особенностей конкретного «железа», как это уже произошло в мире CPU .

🏗 Новая архитектура: агенты и рассуждения 8:35

По мнению Стива Морина, настоящим вызовом для Nvidia станут ИИ-агенты и модели с функцией рассуждения (reasoning). В отличие от чат-ботов, где важна скорость появления каждого токена, для агентов критична общая задержка (latency) — время от начала запроса до финального результата .

Проблемы современных чипов в новых задачах:

🏆 Почему Google победит, а OpenAI — нет 50:34

Стив Морин формулирует «треугольник победы» в гонке ИИ, состоящий из трех элементов:

  1. Продукты (интерфейсы взаимодействия с пользователем).
  2. Данные.
  3. Собственные вычислительные мощности (Compute).

По словам гостя, Google — единственная компания (наряду с Amazon в меньшей степени), обладающая всеми тремя компонентами . Google имеет продукты (Android, Docs), данные и свои чипы TPU, которые Морин называет самыми зрелыми на рынке после Nvidia .

Ситуация с OpenAI выглядит иначе:

🇨🇳 Феномен DeepSeek и уроки эффективности 1:06:43

Успех китайской модели DeepSeek стал для индустрии «сигналом к пробуждению». Морин считает, что экспортные ограничения США стали для Китая «матерью инноваций» . Не имея возможности просто купить больше мощностей, китайские инженеры были вынуждены сосредоточиться на эффективности.

Уроки DeepSeek по версии Морина:

🚀 Будущее: World Models и отказ от трансформеров 55:02

В долгосрочной перспективе Морин делает ставку на «модели мира» (World Models), концепцию которых продвигает Ян Лекун из Meta. LLM — это лишь узкое окно в мир через язык, который передает информацию с потерями .

Гость выделяет перспективные направления:

Стив Морин критически относится к мега-проектам вроде Stargate (план Microsoft и OpenAI на $500 млрд). Он называет это «американским стилем» — попыткой грубой силой и вертикальным масштабированием решить проблему, которая требует инженерного изящества и эффективности . «Это как огромный американский автомобиль: он большой, ест много бензина, но это не значит, что это хорошая машина», — резюмирует эксперт .

💬 Цитаты

«Если вы не владеете своими вычислениями (compute), вы начинаете забег с гирей на щиколотке.»

Стив Морин 00:10

«Nvidia тратит массу энергии, заставляя вас заботиться о вещах, которые не должны вас волновать, вроде CUDA.»

Стив Морин 36:47

«DeepSeek стал отличным сигналом к пробуждению: внезапно эффективность снова стала модной.»

Стив Морин 54:49
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс (Inference)
Процесс использования уже обученной ИИ-модели для получения ответов на запросы.
SRAM
Сверхбыстрая память, расположенная непосредственно на чипе процессора.
TPU (Tensor Processing Unit)
Специализированные процессоры Google, оптимизированные для задач машинного обучения.
RAG (Retrieval-Augmented Generation)
Метод, при котором ИИ ищет информацию во внешних базах данных перед формированием ответа.
📊 Цифры
🗓 Хронология
  1. 2023 Выход Nvidia H100 и начало бума генеративного ИИ.
  2. Октябрь 2024 Морин начинает получать письма о скидках на вычислительные мощности, что сигнализирует о переизбытке предложения.
  3. 2025 Ожидаемый выход чипов Blackwell, вокруг которых уже возникают опасения из-за перегрева.
⚖️ Другая сторона
Технологии и IT Стив Морин Nvidia Google DeepSeek OpenAI