# Директор Z.ai Цзысюнь Ли: «Мы выпускаем модели через несколько часов после обучения»

Источник: https://www.youtube.com/watch?v=5eMuRtaCeoI
Канал: The Cognitive Revolution
Опубликовано: 03.12.2025

---

В новом выпуске подкаста **The Cognitive Revolution** ведущий **Нейтан Лабенц (Nathan Labenz)** совместно с **Джорданом Шнайдером (Jordan Schneider)** и аналитиком **ChinaTalk** Айрин Джонг обсуждают внутреннюю кухню китайского ИИ-гиганта **Z.ai** (также известного как Zhipu AI). Гость программы — **Цзысюнь Ли (Zishwin Lee)**, директор по продукту и стратегии генеративного ИИ в Z.ai, рассказывает о том, как компания прошла путь от академического стартапа до создателя моделей GLM, занимающих топовые позиции в мировых бенчмарках, и почему китайский подход к разработке ИИ радикально отличается от западного.

## 🏛️ Истоки: от академического поиска к погоне за AGI
[[JUMP:07:19]]

История **Z.ai** началась в 2019 году, задолго до бума больших языковых моделей (LLM) [07:32]. Первоначально команда не планировала заниматься текстами в их нынешнем виде. Основатели компании — выходцы из лаборатории Университета Цинхуа — сфокусировались на графовых вычислениях и сетях.

Их первым значимым продуктом стал **A-Miner** — интеллектуальная поисковая система для ученых, своего рода продвинутый аналог Google Scholar [07:44]. Система использовала нейросети для построения связей между авторами, статьями и научными журналами, позволяя визуализировать вклад каждого исследователя в мировую науку.

Переломный момент наступил в 2020 году:

*   **Смена парадигмы:** Команда осознала потенциал LLM и переключила ресурсы на исследование языковых архитектур.
*   **Опережение графика:** В 2021 году компания опубликовала статью о своей архитектуре **GLM** (General Language Model). По словам Ли, это произошло за год до появления GPT-3.5 [08:24].
*   **Уникальность:** В отличие от стандартных архитектур того времени, GLM изначально проектировалась как более гибкая модель, способная эффективно справляться с различными задачами — от понимания текста до его генерации.

## 🚀 Скорость как религия: релиз за несколько часов
[[JUMP:1:14:12]]

Одной из самых поразительных черт **Z.ai** является скорость итераций. В то время как западные лаборатории могут месяцами проводить «красные проверки» (red-teaming) и готовить маркетинговые кампании, в Пекине придерживаются другого темпа.

Цзысюнь Ли утверждает, что модель может быть представлена публике всего через несколько часов после завершения её обучения [1:14:24]. Процесс выглядит следующим образом:

1.  Завершение финального этапа обучения.
2.  Быстрая оценка результатов (бенчмаркинг).
3.  Публикация весов модели в открытом доступе.

Ли признает, что такой темп создает огромный стресс для департамента маркетинга и партнерств [1:15:46]. Ему часто приходится вести переговоры с международными партнерами, такими как **Fireworks** или разработчиками кодинг-агентов, буквально за два-три часа до того, как код появится на GitHub, иногда поднимая людей посреди ночи [1:16:13].

## 🛠️ Культура «играющих тренеров» и PhD-студентов
[[JUMP:15:26]]

Внутренняя структура **Z.ai** построена на принципах максимальной плотности талантов и отсутствия бюрократии. Команда обучения (training team) и команда пост-тренинга (post-train team) сидят в одном помещении и работают над единой целью — созданием унифицированной модели [16:04].

Ключевые особенности HR-стратегии компании:

*   **Основатель-разработчик:** Ли подчеркивает, что даже основатель компании сам проводит эксперименты и читает научные статьи, а не просто ставит задачи [17:26].
*   **Слияние учебы и работы:** В лабораториях **Z.ai** работает множество действующих PhD-студентов. Для них успех модели GLM является их главным академическим достижением [18:51].
*   **Отсутствие предвзятости к «возвращенцам»:** Ли опровергает слухи о том, что в китайских ИИ-компаниях якобы дискриминируют тех, кто учился на Западе (как, например, в случае с DeepSeek) [23:13]. Сам Ли окончил **MIT**, но утверждает, что внутри компании об этом знают едва ли десять человек — важен только результат [24:35].

## 🌍 Опенсорс как стратегия выживания на Западе
[[JUMP:27:55]]

Многие задаются вопросом, почему китайские компании так активно выкладывают свои лучшие модели (GLM-4.5, Qwen, DeepSeek) в открытый доступ. По мнению Цзысюнь Ли, это не идеологический выбор, а прагматичный расчет.

Основные причины «открытости» китайских лабораторий:

*   **Недоверие к API:** По словам Ли, западные компании крайне неохотно используют API китайских разработчиков из-за вопросов безопасности и хранения данных [28:53].
*   **Глобальное признание:** Опенсорс — это единственный способ для китайского стартапа войти в мировой дискурс. Ли отмечает, что они внимательно следят за обсуждениями на Reddit, X (Twitter) и YouTube [31:11].
*   **Маркетинговый эффект:** Успех модели в западных сообществах повышает капитализацию бренда даже внутри Китая. Китайские корпорации охотнее покупают услуги Z.ai, если видят, что их хвалят эксперты из Кремниевой долины [32:47].

## 🎮 Ролевые игры и «дерзкий» перевод: китайская специфика
[[JUMP:40:37]]

При разработке моделей **Z.ai** ориентируется на специфические запросы локального рынка, которые отличаются от западных приоритетов.

**Ролевые игры (Roleplay):**
В Китае огромным спросом пользуются ИИ-ассистенты для эмоциональной поддержки и отыгрыша персонажей [41:26]. Чтобы модель не «забывала» свою роль, **Z.ai** проводит массированный пост-тренинг на длинных инструкциях. Модели обучают следовать сложным системным промптам на десятки страниц, сохраняя эмоции и манеру поведения персонажа (например, Стьюи Гриффина из «Гриффинов») [42:55].

**Перевод и мемы:**
Модели GLM показывают выдающиеся результаты в переводе с китайского на английский, особенно когда дело касается интернет-сленга.

*   **Секрет успеха:** Использование синтетических данных и анализ комментариев в Douyin (китайский TikTok) [54:22].
*   **Контекст:** Ли приводит пример с эмодзи — модель понимает, когда значок кита заменяет название компании DeepSeek в зашифрованном чате, и может корректно перевести этот подтекст [52:21].

## 🧱 Тупик масштабирования и «стена» данных
[[JUMP:1:07:38]]

Несмотря на оптимизм, Цзысюнь Ли выражает скепсис относительно бесконечного масштабирования текущих архитектур. Он считает, что в индустрии существует «стена», которую невозможно преодолеть только за счет данных [1:08:05].

Ли полагает, что:

*   Для следующего качественного скачка нужны фундаментальные прорывы в архитектуре, а не просто больше GPU [1:08:19].
*   Эксперименты на малых моделях (9B или 30B параметров) показывают, что 90% гипотез о масштабировании оказываются ошибочными [1:09:11].
*   В 2025 году **Z.ai** сосредоточится на выпуске более компактных и быстрых моделей, таких как **GLM-4.6 Air** и **Mini** (около 30 млрд параметров) [1:13:18].

## 🏃‍♂️ Энергия и марафоны: как работает Z.ai
[[JUMP:1:22:56]]

В финале беседы Ли делится необычной деталью корпоративной культуры: вместо корпоративных гимнов в компании процветает культ бега. Основатель **Z.ai** — профессиональный марафонец, пробегающий дистанцию менее чем за 3 часа [1:23:14].

Годовщины компании отмечаются проведением полумарафонов [1:23:40]. По мнению Ли, это идеальная метафора их работы: разработка ИИ — это забег на длинную дистанцию, требующий колоссальной выносливости и энергии [1:24:22].

---