# Джонатан Росс: «Мы заберем у NVIDIA рынок инференса»

Источник: https://www.youtube.com/watch?v=xBMRL_7msjY
Канал: 20VC (Harry Stebbings)
Опубликовано: 17.02.2025

---

Джонатан Росс, основатель и CEO компании Groq, в беседе с Гарри Стеббингсом анализирует тектонические сдвиги в индустрии искусственного интеллекта. В то время как мир сосредоточен на дефиците чипов для обучения моделей, Росс делает ставку на инференс (исполнение моделей), утверждая, что именно здесь развернется главная битва за эффективность и доминирование на рынке.

## 📈 Законы масштабирования и эпоха синтетических данных
[[JUMP:01:32]]

Обсуждение будущего ИИ начинается с анализа «законов масштабирования» (scaling laws), сформулированных OpenAI. По мнению Джонатана Росса, общепринятое понимание этих законов часто бывает ошибочным [01:46]. Традиционно считается, что для улучшения модели нужно просто больше параметров и больше данных, но Росс указывает на важность качества данных. Он приводит аналогию с обучением ребенка: мы не даем ему сразу сложные задачи по математическому анализу, мы ведем его от простого к сложному [02:25].

Ключевые тезисы Росса о данных:

*   **Синтетические данные лучше «мусора из интернета»:** Модели могут генерировать данные сами для себя (по аналогии с AlphaGo Zero). Высококачественные синтетические данные позволяют обходить плато эффективности [03:05].
*   **Система 1 и Система 2:** Росс опирается на концепцию Даниэля Канемана. Обучение делает модель интуитивной («быстрое мышление»), а алгоритмы поверх модели (runtime compute) добавляют рассуждение («медленное мышление») [06:08].
*   **Математические пределы:** ЛЛМ (LLM) испытывают трудности с умножением больших чисел не из-за нехватки данных, а из-за архитектурных ограничений (Big O complexity). Им нужно «пространство для раздумий» — промежуточные шаги вычислений [05:06].

Росс утверждает, что вычислительная мощность (compute) — это «мягкое узкое место» (soft neck). Если алгоритмы или данные несовершенны, их можно временно компенсировать избытком вычислений, что делает железо самым простым рычагом влияния на результат [08:22].

## ⚔️ NVIDIA vs Groq: Разделение рынков обучения и инференса
[[JUMP:09:14]]

Джонатан Росс уверен, что инференс в конечном итоге станет в 10–20 раз более ресурсозатратным процессом, чем обучение [09:26]. Он не рассматривает NVIDIA как прямого конкурента, скорее как партнера в экосистеме. По мнению Росса, NVIDIA будет продавать каждый произведенный GPU для обучения (high margin business), а Groq возьмет на себя массовый рынок инференса (high volume business) [11:13].

Сравнение технологий и подходов:

1.  **Проблема HBM (High Bandwidth Memory):** NVIDIA зависит от специализированной памяти, которую производят всего три компании (SK Hynix, Samsung, Micron). Это «ресурс в углу» (cornered resource), ограничивающий масштабирование [17:04].
2.  **Архитектура LPU (Language Processing Unit):** В отличие от GPU, чипы Groq не используют внешнюю память HBM. Данные проходят через цепочку чипов, как по конвейеру на заводе [19:06].
3.  **Энергоэффективность:** Благодаря отсутствию необходимости заряжать и разряжать длинные провода для связи с внешней памятью, LPU потребляет в 3 раза меньше энергии на токен, чем GPU [19:47].
4.  **Предсказуемость:** Система Groq на 100% детерминирована. В то время как передача данных в сетях на базе GPU напоминает непредсказуемый трафик в Париже, LPU работают как поезда по расписанию [23:48].

Росс критикует маркетинговую стратегию NVIDIA, называя заявления о «30-кратном ускорении» игрой цифрами (speckmanship) [25:20]. Он считает, что в корпоративных продажах до сих пор продают «пузырьки в мыле» вместо реальной эффективности (токены на доллар и токены на ватт) [26:40].

## 💰 Сделка в Саудовской Аравии и новая бизнес-модель
[[JUMP:38:17]]

Одним из самых обсуждаемых событий стала сделка Groq с Aramco и новыми структурами в Саудовской Аравии. Росс уточняет: это не раунд инвестиций на $1,5 млрд, а **выручка (Revenue)** [38:43].

Детали финансовой модели:

*   **Партнерский CAPEX:** Партнеры (например, Саудовская Аравия) вкладывают средства в покупку чипов и строительство дата-центров, а Groq делит с ними прибыль от эксплуатации [39:08].
*   **Масштабирование:** На начало 2024 года у Groq было 640 чипов. К концу года — более 40 000. В 2025 году цель — более 2 млн чипов [16:25].
*   **Маржинальность:** Начальная маржа Groq в таких сделках составляет около 20% (в противовес 70–80% у NVIDIA), но она растет по мере окупаемости проекта и выхода на целевой IRR [31:26].

Цель Джонатана Росса амбициозна: к концу 2027 года обеспечивать как минимум половину мирового объема инференса ИИ [41:10]. По его словам, когда компания растет быстрее, чем экспоненциально, текущая прибыль не имеет значения — важен только захват доли рынка [41:40].

## ⚡️ Пузырь дата-центров и энергетический кризис
[[JUMP:32:34]]

Росс предупреждает о серьезном заблуждении инвесторов: многие считают дата-центры объектами недвижимости, хотя на самом деле это сложная инженерная инфраструктура [34:41]. По его мнению, на рынке наблюдается «эхо спроса»: когда один гиперскейлер запрашивает 1 ГВт мощности у 60 разных застройщиков, возникает иллюзия спроса в 60 ГВт [33:00].

Основные риски инфраструктуры:

*   **Дефицит компонентов:** Срок ожидания генераторов для дата-центров сейчас составляет 90 месяцев (7,5 лет) [35:07].
*   **Вода:** Многие новички в индустрии забывают, что чипам нужно колоссальное количество воды для охлаждения [35:20].
*   **Энергетическое «бутылочное горлышко»:** Через 3–4 года нехватка электроэнергии станет жестким ограничителем роста всей индустрии ИИ [34:16].

## 🧠 Философия управления: «Анти-Founder Mode»
[[JUMP:1:13:00]]

В вопросах управления Джонатан Росс придерживается позиции, противоположной популярному сейчас «режиму основателя» (founder mode). Он верит в делегирование и считает, что если лидеру приходится постоянно говорить сотрудникам, как делать их работу, значит, наняты не те люди [1:13:10].

Принципы команды Groq:

*   **Плотность талантов:** В компании всего 300 человек. Они создали собственный чип, компилятор, сетевое оборудование и облачную платформу [1:54:21].
*   **Монета вызова (Challenge Coin):** Каждый сотрудник носит монету с надписью «25 миллионов токенов в секунду». Если на совещании обсуждается что-то, что не ведет к этой цели, сотрудник может просто постучать монетой по столу, призывая к порядку [1:13:36].
*   **Отказ от кадровых войн:** Groq принципиально не предлагает самые высокие зарплаты на рынке. Росс ищет людей, ориентированных на миссию, а не на бесплатный капучино или высокую компенсацию [51:05].

Джонатан делится личной историей о временах, когда компания была на грани банкротства. Они выпустили «облигации Groq» (war bonds): 80% сотрудников согласились снизить зарплату до минимума в обмен на опционы [13:18]. Этот акт уязвимости и доверия спас компанию, когда на счету оставалось меньше денег, чем они сэкономили на зарплатах [14:11].

## 🌍 Геополитика: DeepSeek, Китай и стагнация Европы
[[JUMP:57:42]]

По мнению Росса, успех китайской модели DeepSeek — это «Спутник 2.0» для США [58:24]. Хотя Китай ограничен в доступе к самым передовым чипам (Blackwell и др.), у них есть преимущество в масштабе и скорости принятия решений (например, в строительстве ядерных реакторов для питания ИИ) [59:05]. Однако цензура и страх перед свободой слова в Китае остаются главными тормозами инноваций. «Если вы занимаетесь ИИ в Китае, ваш главный страх — стать вторым Джеком Ма», — отмечает Росс [1:01:06].

Относительно Европы гость высказывается критически:

1.  **Избыточное регулирование:** Нанимать 1500 человек для контроля безопасности ИИ до того, как индустрия создана — это путь в никуда [1:04:35].
2.  **Идея «Города F»:** Росс предлагает создать в Европе город-анклав с миллионом «рисковых» людей, особыми экономическими условиями и отменой запретов на быстрый переход сотрудников из компании в компанию (non-compete clauses) [1:05:15].
3.  **Застой гигантов:** По его мнению, у компаний нет «права быть инкумбентом» и почивать на лаврах, защищаясь регуляциями от молодых стартапов [1:06:22].

## 🔮 Прогнозы: Бессмертие и 8 миллиардов предпринимателей
[[JUMP:1:17:10]]

Джонатан Росс озвучивает «безумный» прогноз: в ближайшие 10 лет человечество может пережить «момент Manjaro» (популярный препарат для похудения) в области борьбы со старением [1:17:50]. Если замедление старения физически возможно, то ИИ найдет способ сделать это внезапно и эффективно.

В социальном плане Росс верит, что ИИ разблокирует творческий потенциал миллионов людей. Программирование на естественном языке позволит 1,4 миллиарда человек в Африке создавать приложения так же легко, как они говорят [1:25:00]. Это превратит мир из сообщества потребителей в мир 8 миллиардов предпринимателей.

---