Уэс Рот о триумфе Kimi K2: почему китайские нейросети обходятся в разы дешевле западных аналогов

Wes Roth 30,5 тыс. 11 мин 4 мин 09.11.2025
Главное

Выход новой китайской модели искусственного интеллекта Kimi K2 от компании Moonshot AI вызвал широкий резонанс в индустрии. Техно-аналитик и автор канала Wes Roth (Уэс Рот) детально разбирает, почему эта открытая модель не только ставит рекорды на тестах, но и раскрывает хитрую стратегию Китая в глобальной гонке вооружений ИИ.

🚀 Технологический прорыв Kimi K2 и новые рекорды 0:00

Модель Kimi K2 позиционируется разработчиками как «думающий агент» (thinking agent). По словам Уэса Рота, она уже успела занять лидирующие позиции в ряде ключевых бенчмарков, обойдя такие западные аналоги, как Claude 3.5 Sonnet и даже, в некоторых аспектах, будущие итерации GPT-5 .

Ключевые технические достижения модели включают:

Как отмечает Уэс Рот, Kimi K2 является более масштабной и усовершенствованной версией модели DeepSeek R1 . Она активно использует концепцию «масштабирования во время выполнения» (test-time scaling), которая стала известна широкой публике после выхода модели o1 от OpenAI .

🧠 Секрет «мышления»: масштабирование в реальном времени 1:07

Основное отличие новых «думающих» моделей заключается в переходе от простого обучения (pre-train compute) к вычислениям во время генерации ответа (test-time compute). По мнению Рота, это критический сдвиг в развитии отрасли: теперь точность модели зависит не только от того, сколько данных в неё «закачали» при создании, но и от того, сколько вычислительных ресурсов ей позволяют потратить на «размышления» перед выдачей ответа .

Особенности работы Kimi K2 в этом режиме:

💰 Экономический шок: $4,6 миллиона против миллиардов 3:56

Одним из самых обсуждаемых фактов стала стоимость обучения Kimi K2. По данным CNBC, компания Moonshot AI, поддерживаемая Alibaba, потратила на обучение модели всего 4,6 миллиона долларов . Для сравнения, DeepSeek заявляла о затратах в 5,6 миллиона долларов на свою версию V3 .

Уэс Рот анализирует этот феномен «дешёвого прорыва»:

  1. Эффект догоняющего: Рот объясняет, что первому инноватору всегда сложнее и дороже прокладывать путь (инвестиции в исследования, инфраструктуру, данные). Однако для тех, кто идет следом, стоимость «догона» падает в геометрической прогрессии .
  2. Дистилляция знаний: Китайские лаборатории часто используют данные, полученные от американских моделей (OpenAI, Google), для обучения своих систем .
  3. Критика данных CNBC: Автор канала выразил сомнение в корректности сравнений СМИ, когда стоимость обучения одной китайской модели противопоставляют общим операционным убыткам OpenAI в миллиарды долларов. По мнению Рота, обучение топовых моделей в США стоит десятки миллионов, но никак не миллиарды за одну итерацию .

🛡️ Геополитическая стратегия: «Секретность по умолчанию» 7:27

Уэс Рот, ссылаясь на экспертов по Китаю, раскрывает возможную стратегию китайского руководства в сфере высоких технологий. Он полагает, что реальный уровень развития китайского ИИ может быть выше того, что мы видим в открытом доступе .

Суть этой стратегии (по мнению Рота):

🏎️ Итоги: Гонка в стиле Mario Kart 10:02

В завершение Уэс Рот приводит наглядную аналогию с игрой Mario Kart. В этой игре есть «механика догона»: тот, кто идет последним, получает бонусы и ускорение, а лидер — штрафы.

Автор делает два основных вывода:

  1. Никто не уйдет в отрыв: Маловероятно, что какая-то одна компания или страна сможет лидировать в гонке ИИ с огромным отрывом долгое время. Любой прорыв будет быстро скопирован и удешевлен конкурентами .
  2. Мы не знаем всей правды: Настоящие возможности китайских лабораторий могут оставаться скрытыми до тех пор, пока Запад не представит что-то сопоставимое .

Китай успешно конвертирует свое преимущество в физическом производстве в доминирование в софтверной сфере, фактически «выбивая почву» из-под ног западных компаний за счет демпинга и открытого кода .

💬 Цитаты

«Любой большой успех на западной стороне будет встречен равным увеличением возможностей на китайской стороне, зачастую гораздо дешевле.»

«Гонка ИИ — это как Mario Kart: у того, кто сзади, всегда есть преимущества, позволяющие быстро догнать лидера.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Test-time scaling
Увеличение вычислительной мощности, выделяемой нейросети непосредственно в момент генерации ответа для улучшения качества рассуждений.
Knowledge distillation
Процесс обучения компактной (ученической) модели на данных и ответах более мощной (учительской) модели.
Tool calls
Способность нейросети самостоятельно обращаться к внешним программам, калькуляторам или поисковикам для решения задачи.
📊 Цифры
🗓 Хронология
  1. Февраль 2025 Выход модели Kimi K2 и публикация данных о её производительности.
⚖️ Другая сторона
Искусственный интеллект Kimi K2 Moonshot AI DeepSeek OpenAI Wes Roth