Джонатан Росс, основатель и CEO компании Groq, в беседе с Гарри Стеббингсом анализирует тектонические сдвиги в индустрии искусственного интеллекта. В то время как мир сосредоточен на дефиците чипов для обучения моделей, Росс делает ставку на инференс (исполнение моделей), утверждая, что именно здесь развернется главная битва за эффективность и доминирование на рынке.
📈 Законы масштабирования и эпоха синтетических данных 1:32
Обсуждение будущего ИИ начинается с анализа «законов масштабирования» (scaling laws), сформулированных OpenAI. По мнению Джонатана Росса, общепринятое понимание этих законов часто бывает ошибочным . Традиционно считается, что для улучшения модели нужно просто больше параметров и больше данных, но Росс указывает на важность качества данных. Он приводит аналогию с обучением ребенка: мы не даем ему сразу сложные задачи по математическому анализу, мы ведем его от простого к сложному .
Ключевые тезисы Росса о данных:
- Синтетические данные лучше «мусора из интернета»: Модели могут генерировать данные сами для себя (по аналогии с AlphaGo Zero). Высококачественные синтетические данные позволяют обходить плато эффективности .
- Система 1 и Система 2: Росс опирается на концепцию Даниэля Канемана. Обучение делает модель интуитивной («быстрое мышление»), а алгоритмы поверх модели (runtime compute) добавляют рассуждение («медленное мышление») .
- Математические пределы: ЛЛМ (LLM) испытывают трудности с умножением больших чисел не из-за нехватки данных, а из-за архитектурных ограничений (Big O complexity). Им нужно «пространство для раздумий» — промежуточные шаги вычислений .
Росс утверждает, что вычислительная мощность (compute) — это «мягкое узкое место» (soft neck). Если алгоритмы или данные несовершенны, их можно временно компенсировать избытком вычислений, что делает железо самым простым рычагом влияния на результат .
⚔️ NVIDIA vs Groq: Разделение рынков обучения и инференса 9:14
Джонатан Росс уверен, что инференс в конечном итоге станет в 10–20 раз более ресурсозатратным процессом, чем обучение . Он не рассматривает NVIDIA как прямого конкурента, скорее как партнера в экосистеме. По мнению Росса, NVIDIA будет продавать каждый произведенный GPU для обучения (high margin business), а Groq возьмет на себя массовый рынок инференса (high volume business) .
Сравнение технологий и подходов:
- Проблема HBM (High Bandwidth Memory): NVIDIA зависит от специализированной памяти, которую производят всего три компании (SK Hynix, Samsung, Micron). Это «ресурс в углу» (cornered resource), ограничивающий масштабирование .
- Архитектура LPU (Language Processing Unit): В отличие от GPU, чипы Groq не используют внешнюю память HBM. Данные проходят через цепочку чипов, как по конвейеру на заводе .
- Энергоэффективность: Благодаря отсутствию необходимости заряжать и разряжать длинные провода для связи с внешней памятью, LPU потребляет в 3 раза меньше энергии на токен, чем GPU .
- Предсказуемость: Система Groq на 100% детерминирована. В то время как передача данных в сетях на базе GPU напоминает непредсказуемый трафик в Париже, LPU работают как поезда по расписанию .
Росс критикует маркетинговую стратегию NVIDIA, называя заявления о «30-кратном ускорении» игрой цифрами (speckmanship) . Он считает, что в корпоративных продажах до сих пор продают «пузырьки в мыле» вместо реальной эффективности (токены на доллар и токены на ватт) .
💰 Сделка в Саудовской Аравии и новая бизнес-модель 38:17
Одним из самых обсуждаемых событий стала сделка Groq с Aramco и новыми структурами в Саудовской Аравии. Росс уточняет: это не раунд инвестиций на $1,5 млрд, а выручка (Revenue) .
Детали финансовой модели:
- Партнерский CAPEX: Партнеры (например, Саудовская Аравия) вкладывают средства в покупку чипов и строительство дата-центров, а Groq делит с ними прибыль от эксплуатации .
- Масштабирование: На начало 2024 года у Groq было 640 чипов. К концу года — более 40 000. В 2025 году цель — более 2 млн чипов .
- Маржинальность: Начальная маржа Groq в таких сделках составляет около 20% (в противовес 70–80% у NVIDIA), но она растет по мере окупаемости проекта и выхода на целевой IRR .
Цель Джонатана Росса амбициозна: к концу 2027 года обеспечивать как минимум половину мирового объема инференса ИИ . По его словам, когда компания растет быстрее, чем экспоненциально, текущая прибыль не имеет значения — важен только захват доли рынка .
⚡️ Пузырь дата-центров и энергетический кризис 32:34
Росс предупреждает о серьезном заблуждении инвесторов: многие считают дата-центры объектами недвижимости, хотя на самом деле это сложная инженерная инфраструктура . По его мнению, на рынке наблюдается «эхо спроса»: когда один гиперскейлер запрашивает 1 ГВт мощности у 60 разных застройщиков, возникает иллюзия спроса в 60 ГВт .
Основные риски инфраструктуры:
- Дефицит компонентов: Срок ожидания генераторов для дата-центров сейчас составляет 90 месяцев (7,5 лет) .
- Вода: Многие новички в индустрии забывают, что чипам нужно колоссальное количество воды для охлаждения .
- Энергетическое «бутылочное горлышко»: Через 3–4 года нехватка электроэнергии станет жестким ограничителем роста всей индустрии ИИ .
🧠 Философия управления: «Анти-Founder Mode» 1:13:00
В вопросах управления Джонатан Росс придерживается позиции, противоположной популярному сейчас «режиму основателя» (founder mode). Он верит в делегирование и считает, что если лидеру приходится постоянно говорить сотрудникам, как делать их работу, значит, наняты не те люди .
Принципы команды Groq:
- Плотность талантов: В компании всего 300 человек. Они создали собственный чип, компилятор, сетевое оборудование и облачную платформу .
- Монета вызова (Challenge Coin): Каждый сотрудник носит монету с надписью «25 миллионов токенов в секунду». Если на совещании обсуждается что-то, что не ведет к этой цели, сотрудник может просто постучать монетой по столу, призывая к порядку .
- Отказ от кадровых войн: Groq принципиально не предлагает самые высокие зарплаты на рынке. Росс ищет людей, ориентированных на миссию, а не на бесплатный капучино или высокую компенсацию .
Джонатан делится личной историей о временах, когда компания была на грани банкротства. Они выпустили «облигации Groq» (war bonds): 80% сотрудников согласились снизить зарплату до минимума в обмен на опционы . Этот акт уязвимости и доверия спас компанию, когда на счету оставалось меньше денег, чем они сэкономили на зарплатах .
🌍 Геополитика: DeepSeek, Китай и стагнация Европы 57:42
По мнению Росса, успех китайской модели DeepSeek — это «Спутник 2.0» для США . Хотя Китай ограничен в доступе к самым передовым чипам (Blackwell и др.), у них есть преимущество в масштабе и скорости принятия решений (например, в строительстве ядерных реакторов для питания ИИ) . Однако цензура и страх перед свободой слова в Китае остаются главными тормозами инноваций. «Если вы занимаетесь ИИ в Китае, ваш главный страх — стать вторым Джеком Ма», — отмечает Росс .
Относительно Европы гость высказывается критически:
- Избыточное регулирование: Нанимать 1500 человек для контроля безопасности ИИ до того, как индустрия создана — это путь в никуда .
- Идея «Города F»: Росс предлагает создать в Европе город-анклав с миллионом «рисковых» людей, особыми экономическими условиями и отменой запретов на быстрый переход сотрудников из компании в компанию (non-compete clauses) .
- Застой гигантов: По его мнению, у компаний нет «права быть инкумбентом» и почивать на лаврах, защищаясь регуляциями от молодых стартапов .
🔮 Прогнозы: Бессмертие и 8 миллиардов предпринимателей 1:17:10
Джонатан Росс озвучивает «безумный» прогноз: в ближайшие 10 лет человечество может пережить «момент Manjaro» (популярный препарат для похудения) в области борьбы со старением . Если замедление старения физически возможно, то ИИ найдет способ сделать это внезапно и эффективно.
В социальном плане Росс верит, что ИИ разблокирует творческий потенциал миллионов людей. Программирование на естественном языке позволит 1,4 миллиарда человек в Африке создавать приложения так же легко, как они говорят . Это превратит мир из сообщества потребителей в мир 8 миллиардов предпринимателей.