Директор Z.ai Цзысюнь Ли: «Мы выпускаем модели через несколько часов после обучения»

В новом выпуске подкаста The Cognitive Revolution ведущий Нейтан Лабенц (Nathan Labenz) совместно с Джорданом Шнайдером (Jordan Schneider) и аналитиком ChinaTalk Айрин Джонг обсуждают внутреннюю кухню китайского ИИ-гиганта Z.ai (также известного как Zhipu AI). Гость программы — Цзысюнь Ли (Zishwin Lee), директор по продукту и стратегии генеративного ИИ в Z.ai, рассказывает о том, как компания прошла путь от академического стартапа до создателя моделей GLM, занимающих топовые позиции в мировых бенчмарках, и почему китайский подход к разработке ИИ радикально отличается от западного.

🏛️ Истоки: от академического поиска к погоне за AGI 7:19

История Z.ai началась в 2019 году, задолго до бума больших языковых моделей (LLM) . Первоначально команда не планировала заниматься текстами в их нынешнем виде. Основатели компании — выходцы из лаборатории Университета Цинхуа — сфокусировались на графовых вычислениях и сетях.

Их первым значимым продуктом стал A-Miner — интеллектуальная поисковая система для ученых, своего рода продвинутый аналог Google Scholar . Система использовала нейросети для построения связей между авторами, статьями и научными журналами, позволяя визуализировать вклад каждого исследователя в мировую науку.

Переломный момент наступил в 2020 году:

Смена парадигмы: Команда осознала потенциал LLM и переключила ресурсы на исследование языковых архитектур.
Опережение графика: В 2021 году компания опубликовала статью о своей архитектуре GLM (General Language Model). По словам Ли, это произошло за год до появления GPT-3.5 .
Уникальность: В отличие от стандартных архитектур того времени, GLM изначально проектировалась как более гибкая модель, способная эффективно справляться с различными задачами — от понимания текста до его генерации.

🚀 Скорость как религия: релиз за несколько часов 1:14:12

Одной из самых поразительных черт Z.ai является скорость итераций. В то время как западные лаборатории могут месяцами проводить «красные проверки» (red-teaming) и готовить маркетинговые кампании, в Пекине придерживаются другого темпа.

Цзысюнь Ли утверждает, что модель может быть представлена публике всего через несколько часов после завершения её обучения . Процесс выглядит следующим образом:

Завершение финального этапа обучения.
Быстрая оценка результатов (бенчмаркинг).
Публикация весов модели в открытом доступе.

Ли признает, что такой темп создает огромный стресс для департамента маркетинга и партнерств . Ему часто приходится вести переговоры с международными партнерами, такими как Fireworks или разработчиками кодинг-агентов, буквально за два-три часа до того, как код появится на GitHub, иногда поднимая людей посреди ночи .

🛠️ Культура «играющих тренеров» и PhD-студентов 15:26

Внутренняя структура Z.ai построена на принципах максимальной плотности талантов и отсутствия бюрократии. Команда обучения (training team) и команда пост-тренинга (post-train team) сидят в одном помещении и работают над единой целью — созданием унифицированной модели .

Ключевые особенности HR-стратегии компании:

Основатель-разработчик: Ли подчеркивает, что даже основатель компании сам проводит эксперименты и читает научные статьи, а не просто ставит задачи .
Слияние учебы и работы: В лабораториях Z.ai работает множество действующих PhD-студентов. Для них успех модели GLM является их главным академическим достижением .
Отсутствие предвзятости к «возвращенцам»: Ли опровергает слухи о том, что в китайских ИИ-компаниях якобы дискриминируют тех, кто учился на Западе (как, например, в случае с DeepSeek) . Сам Ли окончил MIT, но утверждает, что внутри компании об этом знают едва ли десять человек — важен только результат .

🌍 Опенсорс как стратегия выживания на Западе 27:55

Многие задаются вопросом, почему китайские компании так активно выкладывают свои лучшие модели (GLM-4.5, Qwen, DeepSeek) в открытый доступ. По мнению Цзысюнь Ли, это не идеологический выбор, а прагматичный расчет.

Основные причины «открытости» китайских лабораторий:

Недоверие к API: По словам Ли, западные компании крайне неохотно используют API китайских разработчиков из-за вопросов безопасности и хранения данных .
Глобальное признание: Опенсорс — это единственный способ для китайского стартапа войти в мировой дискурс. Ли отмечает, что они внимательно следят за обсуждениями на Reddit, X (Twitter) и YouTube .
Маркетинговый эффект: Успех модели в западных сообществах повышает капитализацию бренда даже внутри Китая. Китайские корпорации охотнее покупают услуги Z.ai, если видят, что их хвалят эксперты из Кремниевой долины .

🎮 Ролевые игры и «дерзкий» перевод: китайская специфика 40:37

При разработке моделей Z.ai ориентируется на специфические запросы локального рынка, которые отличаются от западных приоритетов.

Ролевые игры (Roleplay): В Китае огромным спросом пользуются ИИ-ассистенты для эмоциональной поддержки и отыгрыша персонажей . Чтобы модель не «забывала» свою роль, Z.ai проводит массированный пост-тренинг на длинных инструкциях. Модели обучают следовать сложным системным промптам на десятки страниц, сохраняя эмоции и манеру поведения персонажа (например, Стьюи Гриффина из «Гриффинов») .

Перевод и мемы: Модели GLM показывают выдающиеся результаты в переводе с китайского на английский, особенно когда дело касается интернет-сленга.

Секрет успеха: Использование синтетических данных и анализ комментариев в Douyin (китайский TikTok) .
Контекст: Ли приводит пример с эмодзи — модель понимает, когда значок кита заменяет название компании DeepSeek в зашифрованном чате, и может корректно перевести этот подтекст .

🧱 Тупик масштабирования и «стена» данных 1:07:38

Несмотря на оптимизм, Цзысюнь Ли выражает скепсис относительно бесконечного масштабирования текущих архитектур. Он считает, что в индустрии существует «стена», которую невозможно преодолеть только за счет данных .

Ли полагает, что:

Для следующего качественного скачка нужны фундаментальные прорывы в архитектуре, а не просто больше GPU .
Эксперименты на малых моделях (9B или 30B параметров) показывают, что 90% гипотез о масштабировании оказываются ошибочными .
В 2025 году Z.ai сосредоточится на выпуске более компактных и быстрых моделей, таких как GLM-4.6 Air и Mini (около 30 млрд параметров) .

🏃‍♂️ Энергия и марафоны: как работает Z.ai 1:22:56

В финале беседы Ли делится необычной деталью корпоративной культуры: вместо корпоративных гимнов в компании процветает культ бега. Основатель Z.ai — профессиональный марафонец, пробегающий дистанцию менее чем за 3 часа .

Годовщины компании отмечаются проведением полумарафонов . По мнению Ли, это идеальная метафора их работы: разработка ИИ — это забег на длинную дистанцию, требующий колоссальной выносливости и энергии .