Битва за инференс: как чип Jalapeño от OpenAI и китайская GLM 5.2 обрушивают стоимость ИИ

CNBC 19,7 тыс. 52 мин 4 мин 26.06.2026
Главное

Китайские разработчики ИИ продолжают сокращать технологический разрыв с американскими лидерами. После успеха DeepSeek индустрию всколыхнул выход новой модели GLM 5.2 от компании Zhipu (также известной как Z.AI). Эта модель с открытыми весами не только демонстрирует производительность на уровне лучших закрытых решений, но и делает ставку на «интеллект на доллар», радикально снижая стоимость внедрения ИИ для бизнеса.

🚀 Прорыв GLM 5.2: Конец монополии закрытых моделей? 1:02

Новая модель GLM 5.2 от китайской компании Zhipu вызвала ажиотаж в Кремниевой долине . В отличие от многих предыдущих релизов, этот продукт нацелен на выполнение «агентской» работы (agentic work) — сложных многошаговых задач, где модель не просто отвечает на вопрос, а планирует, пишет код и исправляет ошибки в цикле .

Гейб Перейра отметил, что GLM 5.2 стала первой моделью с открытыми весами, которая реально конкурентоспособна с такими «фронтирными» закрытыми моделями, как Opus 4.7 от Anthropic . Основные показатели модели:

Дейрдре Боза подчеркивает, что рынок переходит от одержимости лидербордами (кто умнее?) к прагматичному вопросу: «Что достаточно хорошо для работы и сколько стоит запустить это миллион раз?» .

🏗️ Новая архитектура корпоративного ИИ 8:41

Аарон Леви и Гейб Перейра обсуждают, как появление мощных открытых моделей меняет стратегию ИТ-директоров. Вместо использования одной самой дорогой модели для всех задач, компании переходят к гибридной схеме — «модельному роутингу» .

Подход спикеров к выбору инструментов:

  1. Фронтирные модели (OpenAI, Anthropic): Используются в качестве «оркестраторов», планировщиков или финальных рецензентов для самых критичных задач .
  2. Открытые модели (GLM, Llama, DeepSeek): Берут на себя основной объем работы — обработку тяжелых массивов документов, анализ текста и рутинные операции .

Аарон Леви утверждает, что разрыв между закрытыми и открытыми моделями сейчас составляет всего 3–6 месяцев . Для большинства бизнес-процессов (юридический анализ, генерация маркетинговых активов) такая задержка не является критичной и укладывается в «шум» общего процесса цифровизации компании .

Гейб Перейра добавляет, что открытые модели позволяют компаниям проводить дообучение (post-training) на собственных данных без риска передачи конфиденциальной информации владельцам закрытых платформ . Например, юридические фирмы не могут отправлять детали сделок M&A в общие облака, поэтому для них критически важна возможность запустить модель на собственных серверах .

🛠️ «Jalapeño» от OpenAI и гонка за дешевым инференсом 36:31

Пока Китай лидирует в эффективности моделей, американские гиганты переносят борьбу на уровень «железа». Стейси Расгон проанализировал анонс Jalapeño — первого специализированного чипа для инференса от OpenAI, разработанного совместно с Broadcom всего за 9 месяцев .

Ключевые факты о Jalapeño:

Стейси Расгон считает, что это не «убийца Nvidia», а расширение рынка. OpenAI одновременно закупает оборудование у Nvidia (сделка на 10 ГВт) и AMD (6 ГВт), так как аппетит индустрии к вычислительным мощностям кажется безграничным .

🌏 Геополитика и «Суверенный ИИ» 21:50

Собеседники затронули тему контроля доступа к технологиям. Аарон Леви назвал недавние ограничения экспорта моделей Anthropic (случай с Fable Mythos) «шоком для системы» .

Последствия экспортного контроля:

Гейб Перейра, однако, возражает против мнения, что Китай только копирует: лаборатории вроде Zhipu проводят глубокие оригинальные исследования и опережают многие западные команды в архитектуре агентских систем .

🤖 Будущее: От «синглплеера» к «мультиплееру» в ИИ 31:10

В завершение дискуссии Аарон Леви объяснил суть нового тренда — агентских команд. На примере функции Claude Team от Anthropic он показал переход от ИИ как персонального помощника к ИИ как полноценному цифровому коллеге .

Стейси Расгон резюмирует ситуацию в индустрии через «парадокс Джевонса»: чем дешевле и эффективнее становится инференс (благодаря китайским открытым моделям или новым чипам Broadcom), тем выше будет спрос и тем больше ресурсов будет потреблять человечество .

💬 Цитаты

«Мы можем находиться в ситуации, когда разрыв между открытыми и закрытыми моделями составляет всего 3–6 месяцев.»

Аарон Леви 09:22

«Новая метрика в ИИ — это интеллект на доллар.»

Дейрдре Боза 03:00

«Когда вещи становятся дешевле, люди начинают использовать их чаще — это парадокс Джевонса.»

Стейси Расгон 51:09
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс
Процесс использования уже обученной нейросети для получения ответов на запросы пользователей.
Дистилляция
Метод обучения меньшей и более дешевой нейросети на выводах (ответах) более крупной и мощной модели.
Агентская работа
Способность ИИ самостоятельно выполнять сложные цепочки действий, включая планирование и самопроверку.
Модельный роутинг
Автоматическое распределение задач между разными ИИ-моделями в зависимости от их сложности и стоимости.
📊 Цифры
🗓 Хронология
  1. Апрель Запуск китайской модели DeepSeek V4
  2. Июнь 2026 Релиз GLM 5.2 и анонс чипа Jalapeño от OpenAI
  3. 2027 Ожидаемое начало массовых поставок чипов Jalapeño
⚖️ Другая сторона
Искусственный интеллект GLM 5.2 Zhipu Jalapeño Broadcom Nvidia