# AI Explained: «OpenAI — не бог, а лидерство Запада в ИИ стремительно тает»

Источник: https://www.youtube.com/watch?v=Lo0FDmSbTp4
Канал: AI Explained
Опубликовано: 27.04.2025

---

«OpenAI — не бог»: документальная история DeepSeek, Лян Вэньфэна и модели R1

20 января 2025 года мир технологий испытал тектонический сдвиг: китайская лаборатория DeepSeek выпустила модель R1, которая не только сравнялась по возможностям рассуждения с лидерами западного рынка, но и сделала это за долю от их стоимости. За этим успехом стоит фигура миллиардера Лян Вэньфэна, чья стратегия эффективности и открытости поставила под сомнение доминирование Кремниевой долины.

## 🚀 Прорыв, которого не должно было случиться
[[JUMP:00:00]]

До недавнего времени считалось, что Запад обладает недосягаемым преимуществом в гонке ИИ [00:15]. Исследования становились всё дороже, а компании вроде OpenAI закрывали свои наработки за «завесой коммерческой тайны». DeepSeek R1 разрушила этот сценарий. Модель оказалась невероятно дешевой в обучении, конкурентоспособной и, что важнее всего, доступной для скачивания (open weights) [00:43]. 

Реакция западных гигантов была мгновенной:

*   OpenAI в марте признали, что их преимущество «не является широким и сокращается» [00:57].
*   Представители OpenAI даже призвали запретить модели вроде R1, утверждая, что компания может быть подконтрольна государству и представлять угрозу безопасности [01:11].
*   В то же время DeepSeek уже готовит следующий удар — выпуск модели R2, ожидаемый в ближайшие месяцы [01:23].

## 👤 Лян Вэньфэн: миллиардер, который прячется от толпы
[[JUMP:01:52]]

Основатель DeepSeek Лян Вэньфэн — фигура крайне скрытная. На фоне успеха он столкнулся с таким вниманием в родном городе, что ему пришлось практически бежать из провинции вместе с семьей, чтобы скрыться от толп поклонников [01:52].

Лян — выходец из мира финансов. Он окончил университет в 2008 году, в разгар мирового финансового кризиса, что сформировало его стремление понимать хаос через паттерны [03:37]. 

*   В 2010 году получил степень магистра в области информационных технологий [04:30].
*   В 2016 году основал хедж-фонд Highflyer, который использовал машинное обучение для сверхбыстрой торговли [04:45]. 
*   К 2021 году под управлением фонда было $9,4 млрд, а Лян стал миллиардером к 35 годам [05:21].

По словам одного из партнеров, при первой встрече Лян выглядел как «типичный ботаник с ужасной прической», который грезил о кластере из 10 000 чипов — тогда его слова мало кто воспринимал всерьез [02:56].

## 💡 Технологическое чудо на «багаже» Highflyer
[[JUMP:06:03]]

Путь к DeepSeek начался с уроков, извлеченных из ошибок в хедж-фонде. ИИ-система Highflyer оказалась слишком азартной, что привело к убыткам и публичным извинениям фонда в 2021 году [06:43]. В апреле 2023 года Лян создал DeepSeek как исследовательскую организацию, движимую чистым любопытством, а не жаждой наживы [08:44].

Лян осознанно выбрал стратегию, идущую вразрез с западной:

1.  **Приоритет талантам, а не дипломам:** В команду набирали молодых выпускников, часто игнорируя даже тех, кто вернулся с обучения на Западе [12:47].
2.  **Отсутствие KPI:** Исследователям дали полную свободу совершать ошибки и экспериментировать без давления планов продаж [13:13].
3.  **Игнорирование бенчмарков:** DeepSeek намеренно исключала вопросы с множественным выбором из обучения, чтобы модель реально «умнела», а не просто подстраивалась под тесты [14:07].

## 🛠 Магия эффективности: как обойти санкции и нехватку чипов
[[JUMP:14:33]]

Успех DeepSeek R1 — это не результат вливания бесконечных денег, а цепочка инженерных инноваций, продиктованная необходимостью. Из-за ограничений США на поставку чипов (Nvidia A100/H100) китайским компаниям пришлось буквально выжимать максимум из имеющегося оборудования [19:10]. Порой графические процессоры даже ввозились в страну контрабандой в чемоданах [20:17].

Ключевые технические прорывы:

*   **DeepSeek MoE (Mixture of Experts):** В отличие от стандартных моделей, здесь активируется только нужная часть весов («экспертов») для ответа [14:46]. Инновация Ляна заключалась в создании «общих» экспертов, которые активны всегда, позволяя специализированным сегментам (как форварду в футболе) не отвлекаться на базовые задачи [15:26].
*   **GRPO (Group Relative Policy Optimization):** Новый метод обучения с подкреплением, который отказался от тяжелых «критических моделей» в пользу параллельной генерации ответов и их сравнительной оценки [17:11]. Это позволило радикально сэкономить память видеокарт.
*   **Multi-head Latent Attention:** Механизм, позволяющий разным частям модели совместно использовать скрытые веса, что делает модель компактнее при сохранении интеллекта [18:17].

## 🔎 Феномен R1: почему OpenAI занервничали
[[JUMP:21:00]]

Лян Вэньфэн открыто заявлял, что Китаю пора перестать быть «безбилетником», использующим западные инновации, и стать контрибьютором [21:13]. В конце 2024 года DeepSeek V3 уже заставила западные лаборатории внимательно изучать китайский код. Генеральный директор Anthropic Дарио Амодеи признал, что V3 стала настоящим технологическим прорывом [22:44].

DeepSeek R1 пошла еще дальше, внедрив метод «мыслей вслух» (chain of thought).

*   Модель сначала рассуждает про себя, прежде чем выдать ответ [23:10].
*   Мир увидел процесс «ага-моментов», когда ИИ возвращается назад и исправляет свои же ошибки в логике [24:31].
*   Согласно некоторым тестам, R1 превзошла модель o1 от OpenAI в математике и кодинге [24:04].

OpenAI попытались обвинить DeepSeek в «дистилляции» (краже интеллекта через копирование ответов их модели), но эти обвинения не нашли широкой поддержки, учитывая, что сами OpenAI судятся со множеством правообладателей за использование их данных [32:19].

## 🔮 Будущее: тупик или путь к AGI?
[[JUMP:27:53]]

Несмотря на триумф, перед DeepSeek стоят огромные вызовы. Дарио Амодеи считает, что текущий успех китайцев — временный. По его мнению, для достижения Истинного Общего Интеллекта (AGI) понадобятся десятки миллиардов долларов и миллионы чипов, которые невозможно ввезти контрабандой [28:59]. Он прогнозирует, что разрыв между теми, кто может тратить $10–100 млрд на обучение (Microsoft, Google), и остальными снова вырастет в 2026–2027 годах [28:34].

Однако DeepSeek не планирует останавливаться. В научной статье по R1 есть намеки на разработку «бесконечного контекста» и замену архитектуры Transformer, которая является стандартом индустрии [34:07].

Если Лян Вэньфэн прав и AGI действительно находится в 2, 5 или 10 годах от нас [28:56], то история DeepSeek — это не просто успех одной компании, это сигнал о том, что эпоха автоматизированного интеллекта уже наступила, и правила игры в ней меняются прямо сейчас.