В новом эпизоде подкаста 20VC эксперт по ИИ-инфраструктуре и бывший инженер Google Стив Морин делится радикальным взглядом на будущее индустрии искусственного интеллекта. Он объясняет, почему доминирование Nvidia может оказаться «пузырём», как DeepSeek изменил правила игры в пользу эффективности и почему Google обладает уникальным преимуществом, которого нет у OpenAI.
🛠 ZML и мир без привязки к «железу» 1:00
Стив Морин представляет ZML — фреймворк для машинного обучения, который позволяет запускать любые модели на любом оборудовании без потери производительности . По словам гостя, это решение находится на самом нижнем уровне инфраструктуры, обеспечивая гибкость в выборе между Nvidia, AMD или TPU.
Морин утверждает, что привычное понимание «модели» как набора весов уходит в прошлое. Вместо этого индустрия движется к «созвездиям бэкендов» . Когда пользователь взаимодействует с ИИ, он фактически общается с API, который за кулисами переключается между различными специализированными моделями: например, переходит от LLM к диффузионной модели для генерации изображений .
Ключевые тезисы о гибкости инфраструктуры:
- Эффективность AMD: Переход с Nvidia на AMD при работе с моделями уровня 70B может дать четырехкратное преимущество в стоимости .
- Связка PyTorch и CUDA: Главным препятствием для отказа от Nvidia остается глубокая интеграция самого популярного фреймворка PyTorch с проприетарным ПО Nvidia (CUDA) .
- Искусственный дефицит: Морин считает, что рынок Nvidia самоподдерживается: люди покупают эти чипы, потому что их легче перепродать, и используют их, потому что на них написан весь существующий код .
📉 Почему Nvidia — это пузырь, который может лопнуть 6:30
Несмотря на текущие рыночные успехи Nvidia, Стив Морин выражает серьезные опасения относительно устойчивости их бизнес-модели. Он сравнивает финансовые модели поколений чипов A100 и H100 .
Аргументы гостя против доминирования Nvidia:
- Разрыв в цене и производительности: H100 стоит в пять раз дороже предшественника, но в задачах инференса (исполнения моделей) он быстрее всего в два раза .
- Проблемы амортизации: Компании строят планы амортизации на 6–7 лет, используя GPU в качестве залога, но реальная ценность этого оборудования может упасть быстрее, чем ожидается .
- Переход к инференсу: Сейчас рынок сфокусирован на обучении (training), но через 5 лет, по прогнозу Морина, 95% рынка будет занимать инференс .
Морин полагает, что Nvidia тратит огромные силы на то, чтобы заставить мир верить в незаменимость CUDA, хотя на самом деле это лишь «стечение обстоятельств» . Он называет текущие наценки Nvidia в 90% «безумными» и считает, что ПО должно абстрагироваться от особенностей конкретного «железа», как это уже произошло в мире CPU .
🏗 Новая архитектура: агенты и рассуждения 8:35
По мнению Стива Морина, настоящим вызовом для Nvidia станут ИИ-агенты и модели с функцией рассуждения (reasoning). В отличие от чат-ботов, где важна скорость появления каждого токена, для агентов критична общая задержка (latency) — время от начала запроса до финального результата .
Проблемы современных чипов в новых задачах:
- GPU не создавались для ИИ: Исторически это чипы для рендеринга графики (матриц пикселей). Использование их для ИИ — это «удачный трюк», который начал давать сбои на масштабах LLM .
- Память как узкое место: Передача данных из внешней памяти (HBM) в чип замедляет работу. Решения от Groq или Cerebras используют SRAM (память прямо на чипе), что дает колоссальную скорость, но стоит крайне дорого .
- Будущее за специализированными чипами: Гость выделяет стартапы Etched и Vizzora как перспективных игроков, способных конкурировать с GPU по цене, предлагая архитектуру, заточенную под инференс .
🏆 Почему Google победит, а OpenAI — нет 50:34
Стив Морин формулирует «треугольник победы» в гонке ИИ, состоящий из трех элементов:
- Продукты (интерфейсы взаимодействия с пользователем).
- Данные.
- Собственные вычислительные мощности (Compute).
По словам гостя, Google — единственная компания (наряду с Amazon в меньшей степени), обладающая всеми тремя компонентами . Google имеет продукты (Android, Docs), данные и свои чипы TPU, которые Морин называет самыми зрелыми на рынке после Nvidia .
Ситуация с OpenAI выглядит иначе:
- У OpenAI есть отличный продукт, но нет своих вычислений — они зависят от Microsoft .
- Отсутствие контроля над инфраструктурой означает потерю маржи.
- Google Морин называет «спящим гигантом», который может интегрировать ИИ во все свои сервисы одновременно .
🇨🇳 Феномен DeepSeek и уроки эффективности 1:06:43
Успех китайской модели DeepSeek стал для индустрии «сигналом к пробуждению». Морин считает, что экспортные ограничения США стали для Китая «матерью инноваций» . Не имея возможности просто купить больше мощностей, китайские инженеры были вынуждены сосредоточиться на эффективности.
Уроки DeepSeek по версии Морина:
- Ограничения порождают качество: Если ты не можешь завалить проблему деньгами и чипами, ты пишешь лучший код .
- Демократизация: География больше не имеет значения. Прорывные технологии могут появиться из ниоткуда и сразу изменить карту мира .
- Конец монолитов: Индустрия может прийти к модели «автопроизводителей», где будет много сильных игроков с разными специализациями, а не один победитель, забирающий всё .
🚀 Будущее: World Models и отказ от трансформеров 55:02
В долгосрочной перспективе Морин делает ставку на «модели мира» (World Models), концепцию которых продвигает Ян Лекун из Meta. LLM — это лишь узкое окно в мир через язык, который передает информацию с потерями .
Гость выделяет перспективные направления:
- JEPA (Joint Embedding Predictive Architecture): Попытка заставить ИИ понимать физику и логику мира, минимизируя затраты энергии на переход от одного состояния к другому .
- Диффузионные LLM: Вместо предсказания следующего токена (слога), эти модели генерируют текст «фрагментами», как это делает человеческий мозг .
- Отказ от обучения: Специалисты DeepMind уже почти не занимаются тонкой настройкой (fine-tuning) моделей. Они просто «вбрасывают» данные в огромное контекстное окно модели во время работы .
Стив Морин критически относится к мега-проектам вроде Stargate (план Microsoft и OpenAI на $500 млрд). Он называет это «американским стилем» — попыткой грубой силой и вертикальным масштабированием решить проблему, которая требует инженерного изящества и эффективности . «Это как огромный американский автомобиль: он большой, ест много бензина, но это не значит, что это хорошая машина», — резюмирует эксперт .