# Битва за инференс: как чип Jalapeño от OpenAI и китайская GLM 5.2 обрушивают стоимость ИИ

Источник: https://www.youtube.com/watch?v=wDf1IR8yP9s
Канал: CNBC
Опубликовано: 26.06.2026

---

Китайские разработчики ИИ продолжают сокращать технологический разрыв с американскими лидерами. После успеха DeepSeek индустрию всколыхнул выход новой модели **GLM 5.2** от компании **Zhipu** (также известной как **Z.AI**). Эта модель с открытыми весами не только демонстрирует производительность на уровне лучших закрытых решений, но и делает ставку на «интеллект на доллар», радикально снижая стоимость внедрения ИИ для бизнеса. 

## 🚀 Прорыв GLM 5.2: Конец монополии закрытых моделей?
[[JUMP:1:02]]

Новая модель GLM 5.2 от китайской компании Zhipu вызвала ажиотаж в Кремниевой долине [1:00]. В отличие от многих предыдущих релизов, этот продукт нацелен на выполнение «агентской» работы (agentic work) — сложных многошаговых задач, где модель не просто отвечает на вопрос, а планирует, пишет код и исправляет ошибки в цикле [4:05].

Гейб Перейра отметил, что GLM 5.2 стала первой моделью с открытыми весами, которая реально конкурентоспособна с такими «фронтирными» закрытыми моделями, как Opus 4.7 от Anthropic [5:58]. Основные показатели модели:

*   **Производительность в агентских задачах:** На ключевых бенчмарках GLM 5.2 отстает от Opus 4.8 всего на один процентный пункт [1:42].
*   **Экономическая эффективность:** Стоимость эксплуатации модели составляет всего 1/5 от стоимости использования топовых решений Anthropic [1:50].
*   **Скорость внедрения:** Трафик токенов на платформе OpenRouter показывает, что разработчики переходят на GLM 5.2 быстрее, чем на DeepSeek в апреле [1:13].

Дейрдре Боза подчеркивает, что рынок переходит от одержимости лидербордами (кто умнее?) к прагматичному вопросу: «Что достаточно хорошо для работы и сколько стоит запустить это миллион раз?» [2:47].

## 🏗️ Новая архитектура корпоративного ИИ
[[JUMP:8:41]]

Аарон Леви и Гейб Перейра обсуждают, как появление мощных открытых моделей меняет стратегию ИТ-директоров. Вместо использования одной самой дорогой модели для всех задач, компании переходят к гибридной схеме — «модельному роутингу» [10:53].

Подход спикеров к выбору инструментов:

1.  **Фронтирные модели (OpenAI, Anthropic):** Используются в качестве «оркестраторов», планировщиков или финальных рецензентов для самых критичных задач [15:43].
2.  **Открытые модели (GLM, Llama, DeepSeek):** Берут на себя основной объем работы — обработку тяжелых массивов документов, анализ текста и рутинные операции [16:09].

Аарон Леви утверждает, что разрыв между закрытыми и открытыми моделями сейчас составляет всего 3–6 месяцев [9:22]. Для большинства бизнес-процессов (юридический анализ, генерация маркетинговых активов) такая задержка не является критичной и укладывается в «шум» общего процесса цифровизации компании [11:49].

Гейб Перейра добавляет, что открытые модели позволяют компаниям проводить дообучение (post-training) на собственных данных без риска передачи конфиденциальной информации владельцам закрытых платформ [13:58]. Например, юридические фирмы не могут отправлять детали сделок M&A в общие облака, поэтому для них критически важна возможность запустить модель на собственных серверах [14:11].

## 🛠️ «Jalapeño» от OpenAI и гонка за дешевым инференсом
[[JUMP:36:31]]

Пока Китай лидирует в эффективности моделей, американские гиганты переносят борьбу на уровень «железа». Стейси Расгон проанализировал анонс **Jalapeño** — первого специализированного чипа для инференса от OpenAI, разработанного совместно с Broadcom всего за 9 месяцев [36:19].

Ключевые факты о Jalapeño:

*   **Снижение затрат:** Генеральный директор Broadcom Хок Тан утверждает, что чип снижает стоимость исполнения ИИ-запросов примерно на 50% по сравнению с текущими GPU от Nvidia [36:19].
*   **Скорость разработки:** Использование ИИ-моделей OpenAI для проектирования архитектуры самого чипа позволило сократить цикл разработки до рекордно коротких сроков [36:19].
*   **Масштаб:** У OpenAI есть соглашение с Broadcom на поставку этих чипов общей мощностью 10 гигаватт в ближайшие 5 лет [37:27].

Стейси Расгон считает, что это не «убийца Nvidia», а расширение рынка. OpenAI одновременно закупает оборудование у Nvidia (сделка на 10 ГВт) и AMD (6 ГВт), так как аппетит индустрии к вычислительным мощностям кажется безграничным [39:25].

## 🌏 Геополитика и «Суверенный ИИ»
[[JUMP:21:50]]

Собеседники затронули тему контроля доступа к технологиям. Аарон Леви назвал недавние ограничения экспорта моделей Anthropic (случай с Fable Mythos) «шоком для системы» [21:50]. 

Последствия экспортного контроля:

*   **Смена парадигмы:** Если раньше ПО считалось нейтральным товаром, то теперь доступ к интеллекту становится геополитическим рычагом [23:50].
*   **Стимул для конкурентов:** Страны ЕС и Китай осознали необходимость «суверенного ИИ» — собственных моделей, которые невозможно отключить извне [24:16].
*   **Роль дистилляции:** Китайские лаборатории успешно применяют дистилляцию — обучение маленьких дешевых моделей на ответах больших американских моделей, что позволяет им обходить ограничения и быстро догонять лидеров [3:12].

Гейб Перейра, однако, возражает против мнения, что Китай только копирует: лаборатории вроде Zhipu проводят глубокие оригинальные исследования и опережают многие западные команды в архитектуре агентских систем [27:03].

## 🤖 Будущее: От «синглплеера» к «мультиплееру» в ИИ
[[JUMP:31:10]]

В завершение дискуссии Аарон Леви объяснил суть нового тренда — агентских команд. На примере функции **Claude Team** от Anthropic он показал переход от ИИ как персонального помощника к ИИ как полноценному цифровому коллеге [31:36].

*   **Personal Mode:** ИИ действует как расширение конкретного пользователя [31:49].
*   **Team Mode:** ИИ становится сущностью внутри корпоративного мессенджера (например, Slack). Он имеет доступ к общим ресурсам команды, видит контекст переписки и может самостоятельно готовить презентации или аналитические отчеты для группы сотрудников [32:55].

Стейси Расгон резюмирует ситуацию в индустрии через «парадокс Джевонса»: чем дешевле и эффективнее становится инференс (благодаря китайским открытым моделям или новым чипам Broadcom), тем выше будет спрос и тем больше ресурсов будет потреблять человечество [51:09].