# DeepSeek V4: конец американского доминирования в ИИ?

Источник: https://www.youtube.com/watch?v=UV1WDNe4J5w
Канал: Matthew Berman
Опубликовано: 25.04.2026

---

DeepSeek выпустила новую флагманскую модель V4, которая поддерживает контекстное окно объемом в **1 миллион токенов** [2:52]. Мэттью Берман утверждает: эта разработка способна лишить США лидерства в сфере искусственного интеллекта. Китайская компания создала продукт уровня передовых американских лабораторий, используя ограниченные вычислительные ресурсы и значительно меньшие бюджеты [0:40].

## 🛠 Технологический прорыв DeepSeek V4
[[JUMP:01:32]]

DeepSeek представила модель в двух вариантах: Pro и Flash [2:52]. Версия Pro содержит **1,6 триллиона параметров**, из которых активными являются только 49 миллиардов [3:06]. Такая структура называется **Mixture of Experts** (смесь экспертов). Она позволяет задействовать лишь малую часть нейросети для ответа на конкретный вопрос, что экономит вычислительную мощность [3:18].

Характеристики и возможности новых моделей:

*   **Масштаб обучения:** обе версии обучали на массиве данных объемом 33 триллиона токенов [3:46].
*   **Производительность:** DeepSeek V4 Flash имеет 284 миллиарда параметров (13 миллиардов активных) и позиционируется как быстрая «рабочая лошадка» [3:32].
*   **Навыки:** модель демонстрирует способности к рассуждению и программированию на уровне Claude 3.7 Opus и GPT-5.5 [3:59].

В тестах MMLU Pro и GPQA Diamond китайская разработка лишь незначительно уступает лидерам рынка [4:24]. По мнению Мэттью Бермана, для большинства коммерческих задач такая разница в производительности не имеет значения [5:05].

## 💰 Экономика эффективности и парадокс Джевонса
[[JUMP:02:11]]

DeepSeek тратит на обучение моделей доли от тех сумм, которые вкладывают американские лаборатории [2:11]. Это вызывает панику на фондовых рынках, так как инвесторы начинают сомневаться в оправданности огромных затрат на оборудование Nvidia [1:59].

Экономические аспекты модели:

1.  **Стоимость:** использование DeepSeek V4 стоит в разы дешевле американских аналогов [5:44].
2.  **Парадокс Джевонса:** при снижении стоимости ресурса спрос на него и объемы потребления только растут [2:25].
3.  **Доступность:** версия Flash предлагает производительность по цене «копейки за миллион токенов» [6:10].

Мэттью Берман указывает на график соотношения интеллекта и цены. DeepSeek V4 Pro находится в зоне высокой эффективности: почти такая же умная, как GPT-5.5, но намного доступнее [6:10].

## 🌐 Геополитика и экспортный контроль
[[JUMP:07:18]]

США запрещают Nvidia продавать топовые чипы вроде GB300 в Китай напрямую [7:18]. Несмотря на дефицит мощностей, китайские инженеры совершают алгоритмические прорывы [8:22]. Они создают модели мирового уровня на «урезанных» графических процессорах [8:34].

Ситуация с ресурсами:

*   **Ограничение мощностей:** DeepSeek признает нехватку вычислительных узлов для полноценного запуска версии Pro [12:18].
*   **Планы расширения:** во второй половине года компания планирует запустить **950 суперузлов**, что еще сильнее снизит стоимость использования модели [12:18].
*   **Импортозамещение:** Китай активно разрабатывает собственные чипы, адаптируя их под свои открытые модели [9:01].

## 🛡 Обвинения в дистилляции данных
[[JUMP:09:27]]

Anthropic недавно заявила, что китайские лаборатории проводят «дистилляционные атаки» [9:27]. Это процесс, когда одну нейросеть обучают на ответах другой модели, фактически копируя её интеллектуальную собственность [9:41].

Факты об инциденте:

*   **Масштаб:** у DeepSeek зафиксировано всего **150 000 обменов данными** с моделями конкурентов [11:14].
*   **Сравнение:** компании Moonshot и Minimax использовали миллионы диалогов для тех же целей [11:27].
*   **Контраргумент:** небольшое количество запросов DeepSeek можно объяснить обычным тестированием (бенчмаркингом), а не кражей данных [11:00].

Мэттью Берман отмечает, что DeepSeek публикует подробные отчеты (white papers) о своей архитектуре [12:05]. Это не вяжется с образом компании, которая просто копирует чужие наработки.

## ⚠️ Угроза для американского бизнеса
[[JUMP:13:10]]

Главная проблема для США заключается в привлекательности китайских моделей для бизнеса. Американские компании и их союзники могут выбрать DeepSeek из-за открытого исходного кода и низкой цены [14:20].

Риски для США:

*   **Безопасность:** зависимость от китайской архитектуры может позволить другой стране диктовать повестку или внезапно ограничить доступ к технологиям [15:01].
*   **Инвестиции:** триллионы долларов вкладываются в инфраструктуру ИИ внутри США. Если бизнес перейдет на дешевые китайские аналоги, эти инвестиции не окупятся [15:15].
*   **Культурное влияние:** если раньше западные соцсети контролировали нарратив, то теперь китайские модели могут определять, что пользователям допустимо обсуждать [15:41].

Мэттью Берман призывает американские компании активнее развивать открытое ПО и радикально снижать стоимость использования своих нейросетей [16:21]. В противном случае преимущество в производстве чипов не поможет удержать лидерство [16:47].