Джонатан Росс: «Мы заберем у NVIDIA рынок инференса»

20VC (Harry Stebbings) 148 тыс. 1 ч 25 мин 6 мин 17.02.2025
Главное

Джонатан Росс, основатель и CEO компании Groq, в беседе с Гарри Стеббингсом анализирует тектонические сдвиги в индустрии искусственного интеллекта. В то время как мир сосредоточен на дефиците чипов для обучения моделей, Росс делает ставку на инференс (исполнение моделей), утверждая, что именно здесь развернется главная битва за эффективность и доминирование на рынке.

📈 Законы масштабирования и эпоха синтетических данных 1:32

Обсуждение будущего ИИ начинается с анализа «законов масштабирования» (scaling laws), сформулированных OpenAI. По мнению Джонатана Росса, общепринятое понимание этих законов часто бывает ошибочным . Традиционно считается, что для улучшения модели нужно просто больше параметров и больше данных, но Росс указывает на важность качества данных. Он приводит аналогию с обучением ребенка: мы не даем ему сразу сложные задачи по математическому анализу, мы ведем его от простого к сложному .

Ключевые тезисы Росса о данных:

Росс утверждает, что вычислительная мощность (compute) — это «мягкое узкое место» (soft neck). Если алгоритмы или данные несовершенны, их можно временно компенсировать избытком вычислений, что делает железо самым простым рычагом влияния на результат .

⚔️ NVIDIA vs Groq: Разделение рынков обучения и инференса 9:14

Джонатан Росс уверен, что инференс в конечном итоге станет в 10–20 раз более ресурсозатратным процессом, чем обучение . Он не рассматривает NVIDIA как прямого конкурента, скорее как партнера в экосистеме. По мнению Росса, NVIDIA будет продавать каждый произведенный GPU для обучения (high margin business), а Groq возьмет на себя массовый рынок инференса (high volume business) .

Сравнение технологий и подходов:

  1. Проблема HBM (High Bandwidth Memory): NVIDIA зависит от специализированной памяти, которую производят всего три компании (SK Hynix, Samsung, Micron). Это «ресурс в углу» (cornered resource), ограничивающий масштабирование .
  2. Архитектура LPU (Language Processing Unit): В отличие от GPU, чипы Groq не используют внешнюю память HBM. Данные проходят через цепочку чипов, как по конвейеру на заводе .
  3. Энергоэффективность: Благодаря отсутствию необходимости заряжать и разряжать длинные провода для связи с внешней памятью, LPU потребляет в 3 раза меньше энергии на токен, чем GPU .
  4. Предсказуемость: Система Groq на 100% детерминирована. В то время как передача данных в сетях на базе GPU напоминает непредсказуемый трафик в Париже, LPU работают как поезда по расписанию .

Росс критикует маркетинговую стратегию NVIDIA, называя заявления о «30-кратном ускорении» игрой цифрами (speckmanship) . Он считает, что в корпоративных продажах до сих пор продают «пузырьки в мыле» вместо реальной эффективности (токены на доллар и токены на ватт) .

💰 Сделка в Саудовской Аравии и новая бизнес-модель 38:17

Одним из самых обсуждаемых событий стала сделка Groq с Aramco и новыми структурами в Саудовской Аравии. Росс уточняет: это не раунд инвестиций на $1,5 млрд, а выручка (Revenue) .

Детали финансовой модели:

Цель Джонатана Росса амбициозна: к концу 2027 года обеспечивать как минимум половину мирового объема инференса ИИ . По его словам, когда компания растет быстрее, чем экспоненциально, текущая прибыль не имеет значения — важен только захват доли рынка .

⚡️ Пузырь дата-центров и энергетический кризис 32:34

Росс предупреждает о серьезном заблуждении инвесторов: многие считают дата-центры объектами недвижимости, хотя на самом деле это сложная инженерная инфраструктура . По его мнению, на рынке наблюдается «эхо спроса»: когда один гиперскейлер запрашивает 1 ГВт мощности у 60 разных застройщиков, возникает иллюзия спроса в 60 ГВт .

Основные риски инфраструктуры:

🧠 Философия управления: «Анти-Founder Mode» 1:13:00

В вопросах управления Джонатан Росс придерживается позиции, противоположной популярному сейчас «режиму основателя» (founder mode). Он верит в делегирование и считает, что если лидеру приходится постоянно говорить сотрудникам, как делать их работу, значит, наняты не те люди .

Принципы команды Groq:

Джонатан делится личной историей о временах, когда компания была на грани банкротства. Они выпустили «облигации Groq» (war bonds): 80% сотрудников согласились снизить зарплату до минимума в обмен на опционы . Этот акт уязвимости и доверия спас компанию, когда на счету оставалось меньше денег, чем они сэкономили на зарплатах .

🌍 Геополитика: DeepSeek, Китай и стагнация Европы 57:42

По мнению Росса, успех китайской модели DeepSeek — это «Спутник 2.0» для США . Хотя Китай ограничен в доступе к самым передовым чипам (Blackwell и др.), у них есть преимущество в масштабе и скорости принятия решений (например, в строительстве ядерных реакторов для питания ИИ) . Однако цензура и страх перед свободой слова в Китае остаются главными тормозами инноваций. «Если вы занимаетесь ИИ в Китае, ваш главный страх — стать вторым Джеком Ма», — отмечает Росс .

Относительно Европы гость высказывается критически:

  1. Избыточное регулирование: Нанимать 1500 человек для контроля безопасности ИИ до того, как индустрия создана — это путь в никуда .
  2. Идея «Города F»: Росс предлагает создать в Европе город-анклав с миллионом «рисковых» людей, особыми экономическими условиями и отменой запретов на быстрый переход сотрудников из компании в компанию (non-compete clauses) .
  3. Застой гигантов: По его мнению, у компаний нет «права быть инкумбентом» и почивать на лаврах, защищаясь регуляциями от молодых стартапов .

🔮 Прогнозы: Бессмертие и 8 миллиардов предпринимателей 1:17:10

Джонатан Росс озвучивает «безумный» прогноз: в ближайшие 10 лет человечество может пережить «момент Manjaro» (популярный препарат для похудения) в области борьбы со старением . Если замедление старения физически возможно, то ИИ найдет способ сделать это внезапно и эффективно.

В социальном плане Росс верит, что ИИ разблокирует творческий потенциал миллионов людей. Программирование на естественном языке позволит 1,4 миллиарда человек в Африке создавать приложения так же легко, как они говорят . Это превратит мир из сообщества потребителей в мир 8 миллиардов предпринимателей.


💬 Цитаты

«Ваша работа — не следовать за волной, ваша работа — занять позицию до того, как волна придет.»

Джонатан Росс 11:57

«Когда вы растете быстрее, чем экспоненциально, количество текущей прибыли не имеет значения.»

Джонатан Росс 41:50

«Если бы я знал, что не могу потерпеть неудачу, я бы заказал каждый чип, который только возможно произвести на планете.»

Джонатан Росс 11:54
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс (Inference)
Процесс использования уже обученной модели ИИ для получения предсказаний или ответов на запросы пользователей.
LPU (Language Processing Unit)
Тип процессора, разработанный Groq специально для быстрой работы больших языковых моделей.
HBM (High Bandwidth Memory)
Высокоскоростная многослойная память, критически важная для современных GPU от NVIDIA.
Big O Complexity
Математическая мера оценки того, как сложность алгоритма растет с увеличением объема входных данных.
📊 Цифры
🗓 Хронология
  1. 2017 Основание Groq (приблизительно за 7 лет до достижения Product-Market Fit).
  2. Начало 2024 У Groq в эксплуатации 640 чипов.
  3. Конец 2024 Количество чипов в эксплуатации выросло до 40 000.
  4. 2027 Цель Groq по захвату 50% мирового рынка инференса.
⚖️ Другая сторона
Искусственный интеллект Джонатан Росс Nvidia Groq инференс LPU