В новом эпизоде подкаста a16z Дилан Патель (Dylan Patel), главный аналитик SemiAnalysis, делится скептическим взглядом на «экономический» релиз GPT-5, объясняет, почему конкурентам Nvidia нужно быть в пять раз лучше оригинала, и анализирует, как ИИ-лаборатории пытаются решить проблему захвата стоимости (value capture). В центре дискуссии — «момент роутера» в архитектуре моделей и инфраструктурный кризис, ограничивающий рост американского ИИ.
🧠 GPT-5 и «момент роутера»: Почему модель стала разочарованием 1:10
Дилан Патель характеризует запуск последних версий моделей OpenAI (включая то, что обсуждается как GPT-5) как «экономический релиз», а не качественный скачок в интеллекте . По его мнению, OpenAI сместила фокус с простого наращивания вычислительных мощностей на оптимизацию затрат. Модель не стала физически больше; вместо этого компания внедрила систему автоматической маршрутизации (router) .
Ключевые тезисы Пателя о новой архитектуре:
- Маршрутизация вместо сырой мощи: Система теперь сама решает, какую модель использовать для ответа — базовую, облегченную (mini) или ресурсозатратную «думающую» модель (thinking model) .
- Снижение вычислительных затрат: Ранние версии моделей рассуждения (01, 03) тратили слишком много токенов на простые вопросы. Патель приводит пример: модель могла «думать» 48 секунд над вопросом, является ли свинина красным или белым мясом . GPT-5 тратит на раздумья в среднем 5–10 секунд, что Патель считает признаком оптимизации, а не деградации .
- Управление нагрузкой: Роутер позволяет OpenAI незаметно для пользователя снижать качество ответов в периоды высокой нагрузки на инфраструктуру, перенаправляя запросы на более дешевые модели .
💰 Новая модель монетизации: От подписок к комиссиям 5:00
Традиционная модель платных подписок по $20 в месяц не позволяет OpenAI эффективно зарабатывать на бесплатных пользователях, так как реклама плохо вписывается в интерфейс помощника . Дилан Патель считает, что «момент роутера» открывает путь к транзакционной модели монетизации.
Инвестиционный тезис Пателя: Будущее ИИ-компаний — в превращении в «агентов по закупкам». Если пользователь ищет адвоката или бронирует авиабилет через чат-бот, компания должна не показывать рекламу, а совершать сделку и брать комиссию (take rate) . Патель утверждает, что OpenAI уже работает над интеграцией с календарями и платежными системами, чтобы монетизировать даже бесплатные запросы через агентские действия .
🏎️ Монополия Nvidia и «правило 5x» для конкурентов 13:50
Nvidia занимает доминирующее положение не только благодаря чипам, но и за счет вертикальной интеграции всей цепочки поставок. Патель подчеркивает, что компания контролирует всё: от сетевых решений и памяти (HPM) до медных кабелей и стоек для серверов .
Аргументы Пателя, почему победить Nvidia почти невозможно:
- Эффективность цепочки поставок: Nvidia получает лучшие условия у TSMC и поставщиков памяти, что дает ей преимущество в себестоимости .
- Ценовое давление: Если конкурент создаст чип, который вдвое лучше по соотношению цена/производительность, Nvidia просто временно снизит свою маржу с 75% до более низких значений, чтобы выдавить игрока с рынка .
- Динамика разработки: Цикл проектирования чипа занимает 2–3 года, а архитектуры моделей меняются каждые полгода. К моменту выхода специализированного чипа (например, под трансформеры) исследователи могут уже перейти на новые типы малых матричных умножений, под которые чип не оптимизирован .
По мнению Пателя, чтобы выжить, новый стартап в сфере полупроводников должен предложить решение, которое будет в 5 раз лучше предложений Nvidia, чтобы компенсировать риски софта и цепочки поставок .
☁️ Битва за кастомный кремний: TPU против GPU 21:24
Google, Amazon и Meta активно наращивают заказы на собственные чипы (TPU, Trainium). Патель отмечает, что TPU от Google уже сейчас на 100% загружены внутренними задачами .
Основные выводы по сегменту:
- Google: Патель советует Google начать продавать TPU как физическое оборудование другим компаниям, а не только сдавать в аренду через облако . Это могло бы сделать Google Cloud более конкурентоспособным, но потребует радикальной перестройки корпоративной культуры .
- Amazon: Продукт Trainium пока не достиг уровня зрелости TPU, но Anthropic (портфельная компания Amazon) активно работает над тем, чтобы перевести на него свои нагрузки .
- Концентрация: Кастомный кремний выигрывает в условиях высокой концентрации рынка. Если ИИ-рынок станет фрагментированным (за счет открытых моделей), Nvidia укрепит свои позиции как универсальный стандарт .
🏭 Инфраструктурный кризис и дефицит энергии 42:41
В США строительство дата-центров упирается в физические ограничения электросетей. Патель сообщает, что у Google и Meta есть тысячи готовых чипов, которые простаивают, потому что для них еще не построены или не подключены к сети здания .
Факты об ИИ-инфраструктуре:
- Структура затрат: В современном ЦОДе на базе архитектуры Blackwell около 80% стоимости — это капитальные затраты (чипы, сетевое оборудование, конвертеры питания). На землю, охлаждение и энергию приходится лишь 20% .
- Скорость важнее экономии: Илон Маск использовал дорогие мобильные чиллеры и генераторы, чтобы запустить свой дата-центр на 3 месяца раньше. По расчетам Пателя, эти 3 месяца обучения стоят намного больше, чем переплата за временное оборудование .
- Энергопотребление: Патель называет нарратив об «ИИ, пожирающем воду и энергию» преувеличенным. Например, выращивание люцерны (alfalfa) потребляет в 100 раз больше воды, чем все ИИ-центры вместе взятые .
🏢 Критика тех-гигантов: Советы СЕО 55:46
Дилан Патель прокомментировал состояние крупнейших игроков индустрии:
- Intel: Компания находится в критическом состоянии. Патель утверждает, что в Intel царит абсурдная иерархия, а цикл от разработки до выпуска продукта занимает 5–6 лет против 2–3 лет у конкурентов . Его совет: радикальные сокращения (до 30% персонала) и разделение фабов и дизайна, хотя на это может не хватить времени до банкротства .
- Microsoft: Несмотря на раннее лидерство, Microsoft «упускает OpenAI из рук». Патель считает GitHub Copilot провалом с точки зрения потенциальной выручки, учитывая, что у компании были лучшие IDE, продажи и эксклюзивный доступ к моделям .
- Apple: Патель предупреждает, что Apple рискует «пропустить лодку», если не инвестирует минимум $50 млрд в инфраструктуру. Главная угроза — ИИ станет новым интерфейсом взаимодействия, который сделает экосистему Apple менее значимой .
- Nvidia: Дженсену Хуангу советуют использовать огромный запас наличности (более $100 млрд к концу года) для агрессивного выхода на рынок владения инфраструктурой (ЦОДами), а не ограничиваться только продажей чипов .