Директор Z.ai Цзысюнь Ли: «Мы выпускаем модели через несколько часов после обучения»

The Cognitive Revolution 54,6 тыс. 1 ч 25 мин 5 мин 03.12.2025
Главное

В новом выпуске подкаста The Cognitive Revolution ведущий Нейтан Лабенц (Nathan Labenz) совместно с Джорданом Шнайдером (Jordan Schneider) и аналитиком ChinaTalk Айрин Джонг обсуждают внутреннюю кухню китайского ИИ-гиганта Z.ai (также известного как Zhipu AI). Гость программы — Цзысюнь Ли (Zishwin Lee), директор по продукту и стратегии генеративного ИИ в Z.ai, рассказывает о том, как компания прошла путь от академического стартапа до создателя моделей GLM, занимающих топовые позиции в мировых бенчмарках, и почему китайский подход к разработке ИИ радикально отличается от западного.

🏛️ Истоки: от академического поиска к погоне за AGI 7:19

История Z.ai началась в 2019 году, задолго до бума больших языковых моделей (LLM) . Первоначально команда не планировала заниматься текстами в их нынешнем виде. Основатели компании — выходцы из лаборатории Университета Цинхуа — сфокусировались на графовых вычислениях и сетях.

Их первым значимым продуктом стал A-Miner — интеллектуальная поисковая система для ученых, своего рода продвинутый аналог Google Scholar . Система использовала нейросети для построения связей между авторами, статьями и научными журналами, позволяя визуализировать вклад каждого исследователя в мировую науку.

Переломный момент наступил в 2020 году:

🚀 Скорость как религия: релиз за несколько часов 1:14:12

Одной из самых поразительных черт Z.ai является скорость итераций. В то время как западные лаборатории могут месяцами проводить «красные проверки» (red-teaming) и готовить маркетинговые кампании, в Пекине придерживаются другого темпа.

Цзысюнь Ли утверждает, что модель может быть представлена публике всего через несколько часов после завершения её обучения . Процесс выглядит следующим образом:

  1. Завершение финального этапа обучения.
  2. Быстрая оценка результатов (бенчмаркинг).
  3. Публикация весов модели в открытом доступе.

Ли признает, что такой темп создает огромный стресс для департамента маркетинга и партнерств . Ему часто приходится вести переговоры с международными партнерами, такими как Fireworks или разработчиками кодинг-агентов, буквально за два-три часа до того, как код появится на GitHub, иногда поднимая людей посреди ночи .

🛠️ Культура «играющих тренеров» и PhD-студентов 15:26

Внутренняя структура Z.ai построена на принципах максимальной плотности талантов и отсутствия бюрократии. Команда обучения (training team) и команда пост-тренинга (post-train team) сидят в одном помещении и работают над единой целью — созданием унифицированной модели .

Ключевые особенности HR-стратегии компании:

🌍 Опенсорс как стратегия выживания на Западе 27:55

Многие задаются вопросом, почему китайские компании так активно выкладывают свои лучшие модели (GLM-4.5, Qwen, DeepSeek) в открытый доступ. По мнению Цзысюнь Ли, это не идеологический выбор, а прагматичный расчет.

Основные причины «открытости» китайских лабораторий:

🎮 Ролевые игры и «дерзкий» перевод: китайская специфика 40:37

При разработке моделей Z.ai ориентируется на специфические запросы локального рынка, которые отличаются от западных приоритетов.

Ролевые игры (Roleplay): В Китае огромным спросом пользуются ИИ-ассистенты для эмоциональной поддержки и отыгрыша персонажей . Чтобы модель не «забывала» свою роль, Z.ai проводит массированный пост-тренинг на длинных инструкциях. Модели обучают следовать сложным системным промптам на десятки страниц, сохраняя эмоции и манеру поведения персонажа (например, Стьюи Гриффина из «Гриффинов») .

Перевод и мемы: Модели GLM показывают выдающиеся результаты в переводе с китайского на английский, особенно когда дело касается интернет-сленга.

🧱 Тупик масштабирования и «стена» данных 1:07:38

Несмотря на оптимизм, Цзысюнь Ли выражает скепсис относительно бесконечного масштабирования текущих архитектур. Он считает, что в индустрии существует «стена», которую невозможно преодолеть только за счет данных .

Ли полагает, что:

🏃‍♂️ Энергия и марафоны: как работает Z.ai 1:22:56

В финале беседы Ли делится необычной деталью корпоративной культуры: вместо корпоративных гимнов в компании процветает культ бега. Основатель Z.ai — профессиональный марафонец, пробегающий дистанцию менее чем за 3 часа .

Годовщины компании отмечаются проведением полумарафонов . По мнению Ли, это идеальная метафора их работы: разработка ИИ — это забег на длинную дистанцию, требующий колоссальной выносливости и энергии .


💬 Цитаты

«Если вы хотите открыть исходный код модели, то сам факт открытия — это уже крупнейшее событие.»

«Мы верим, что существует стена. Данные могут улучшить ситуацию, но они не могут помочь пересечь эту стену. Нужна лучшая архитектура.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
GLM (General Language Model)
Собственная архитектура языковых моделей, разработанная Z.ai, альтернатива западным трансформерам.
Red-teaming
Процесс тестирования модели на безопасность, попытки заставить её выдать вредную или запрещенную информацию.
Post-training
Этап дообучения модели на специфических данных (инструкциях) после завершения основного цикла обучения.
📊 Цифры
🗓 Хронология
  1. 2019 Основание Z.ai и запуск научного поисковика A-Miner.
  2. 2020 Переход компании к исследованиям в области больших языковых моделей (LLM).
  3. 2021 Публикация первой научной статьи об архитектуре GLM.
  4. 2024 Выпуск моделей GLM-4.5 и 4.6, получивших мировое признание.
  5. 2025 Планируемый фокус на выпуске компактных моделей (Air/Mini) и улучшении архитектуры.
⚖️ Другая сторона
Искусственный интеллект Z.ai GLM-4 Цзысюнь Ли DeepSeek Zhipu AI