Дилан Патель: «Конкурент Nvidia должен быть в 5 раз лучше, чтобы просто выжить»

В новом эпизоде подкаста a16z Дилан Патель (Dylan Patel), главный аналитик SemiAnalysis, делится скептическим взглядом на «экономический» релиз GPT-5, объясняет, почему конкурентам Nvidia нужно быть в пять раз лучше оригинала, и анализирует, как ИИ-лаборатории пытаются решить проблему захвата стоимости (value capture). В центре дискуссии — «момент роутера» в архитектуре моделей и инфраструктурный кризис, ограничивающий рост американского ИИ.

🧠 GPT-5 и «момент роутера»: Почему модель стала разочарованием 1:10

Дилан Патель характеризует запуск последних версий моделей OpenAI (включая то, что обсуждается как GPT-5) как «экономический релиз», а не качественный скачок в интеллекте . По его мнению, OpenAI сместила фокус с простого наращивания вычислительных мощностей на оптимизацию затрат. Модель не стала физически больше; вместо этого компания внедрила систему автоматической маршрутизации (router) .

Ключевые тезисы Пателя о новой архитектуре:

Маршрутизация вместо сырой мощи: Система теперь сама решает, какую модель использовать для ответа — базовую, облегченную (mini) или ресурсозатратную «думающую» модель (thinking model) .
Снижение вычислительных затрат: Ранние версии моделей рассуждения (01, 03) тратили слишком много токенов на простые вопросы. Патель приводит пример: модель могла «думать» 48 секунд над вопросом, является ли свинина красным или белым мясом . GPT-5 тратит на раздумья в среднем 5–10 секунд, что Патель считает признаком оптимизации, а не деградации .
Управление нагрузкой: Роутер позволяет OpenAI незаметно для пользователя снижать качество ответов в периоды высокой нагрузки на инфраструктуру, перенаправляя запросы на более дешевые модели .

💰 Новая модель монетизации: От подписок к комиссиям 5:00

Традиционная модель платных подписок по $20 в месяц не позволяет OpenAI эффективно зарабатывать на бесплатных пользователях, так как реклама плохо вписывается в интерфейс помощника . Дилан Патель считает, что «момент роутера» открывает путь к транзакционной модели монетизации.

Инвестиционный тезис Пателя: Будущее ИИ-компаний — в превращении в «агентов по закупкам». Если пользователь ищет адвоката или бронирует авиабилет через чат-бот, компания должна не показывать рекламу, а совершать сделку и брать комиссию (take rate) . Патель утверждает, что OpenAI уже работает над интеграцией с календарями и платежными системами, чтобы монетизировать даже бесплатные запросы через агентские действия .

🏎️ Монополия Nvidia и «правило 5x» для конкурентов 13:50

Nvidia занимает доминирующее положение не только благодаря чипам, но и за счет вертикальной интеграции всей цепочки поставок. Патель подчеркивает, что компания контролирует всё: от сетевых решений и памяти (HPM) до медных кабелей и стоек для серверов .

Аргументы Пателя, почему победить Nvidia почти невозможно:

Эффективность цепочки поставок: Nvidia получает лучшие условия у TSMC и поставщиков памяти, что дает ей преимущество в себестоимости .
Ценовое давление: Если конкурент создаст чип, который вдвое лучше по соотношению цена/производительность, Nvidia просто временно снизит свою маржу с 75% до более низких значений, чтобы выдавить игрока с рынка .
Динамика разработки: Цикл проектирования чипа занимает 2–3 года, а архитектуры моделей меняются каждые полгода. К моменту выхода специализированного чипа (например, под трансформеры) исследователи могут уже перейти на новые типы малых матричных умножений, под которые чип не оптимизирован .

По мнению Пателя, чтобы выжить, новый стартап в сфере полупроводников должен предложить решение, которое будет в 5 раз лучше предложений Nvidia, чтобы компенсировать риски софта и цепочки поставок .

☁️ Битва за кастомный кремний: TPU против GPU 21:24

Google, Amazon и Meta активно наращивают заказы на собственные чипы (TPU, Trainium). Патель отмечает, что TPU от Google уже сейчас на 100% загружены внутренними задачами .

Основные выводы по сегменту:

Google: Патель советует Google начать продавать TPU как физическое оборудование другим компаниям, а не только сдавать в аренду через облако . Это могло бы сделать Google Cloud более конкурентоспособным, но потребует радикальной перестройки корпоративной культуры .
Amazon: Продукт Trainium пока не достиг уровня зрелости TPU, но Anthropic (портфельная компания Amazon) активно работает над тем, чтобы перевести на него свои нагрузки .
Концентрация: Кастомный кремний выигрывает в условиях высокой концентрации рынка. Если ИИ-рынок станет фрагментированным (за счет открытых моделей), Nvidia укрепит свои позиции как универсальный стандарт .

🏭 Инфраструктурный кризис и дефицит энергии 42:41

В США строительство дата-центров упирается в физические ограничения электросетей. Патель сообщает, что у Google и Meta есть тысячи готовых чипов, которые простаивают, потому что для них еще не построены или не подключены к сети здания .

Факты об ИИ-инфраструктуре:

Структура затрат: В современном ЦОДе на базе архитектуры Blackwell около 80% стоимости — это капитальные затраты (чипы, сетевое оборудование, конвертеры питания). На землю, охлаждение и энергию приходится лишь 20% .
Скорость важнее экономии: Илон Маск использовал дорогие мобильные чиллеры и генераторы, чтобы запустить свой дата-центр на 3 месяца раньше. По расчетам Пателя, эти 3 месяца обучения стоят намного больше, чем переплата за временное оборудование .
Энергопотребление: Патель называет нарратив об «ИИ, пожирающем воду и энергию» преувеличенным. Например, выращивание люцерны (alfalfa) потребляет в 100 раз больше воды, чем все ИИ-центры вместе взятые .

🏢 Критика тех-гигантов: Советы СЕО 55:46

Дилан Патель прокомментировал состояние крупнейших игроков индустрии:

Intel: Компания находится в критическом состоянии. Патель утверждает, что в Intel царит абсурдная иерархия, а цикл от разработки до выпуска продукта занимает 5–6 лет против 2–3 лет у конкурентов . Его совет: радикальные сокращения (до 30% персонала) и разделение фабов и дизайна, хотя на это может не хватить времени до банкротства .
Microsoft: Несмотря на раннее лидерство, Microsoft «упускает OpenAI из рук». Патель считает GitHub Copilot провалом с точки зрения потенциальной выручки, учитывая, что у компании были лучшие IDE, продажи и эксклюзивный доступ к моделям .
Apple: Патель предупреждает, что Apple рискует «пропустить лодку», если не инвестирует минимум $50 млрд в инфраструктуру. Главная угроза — ИИ станет новым интерфейсом взаимодействия, который сделает экосистему Apple менее значимой .
Nvidia: Дженсену Хуангу советуют использовать огромный запас наличности (более $100 млрд к концу года) для агрессивного выхода на рынок владения инфраструктурой (ЦОДами), а не ограничиваться только продажей чипов .