AI Explained: «OpenAI — не бог, а лидерство Запада в ИИ стремительно тает»

«OpenAI — не бог»: документальная история DeepSeek, Лян Вэньфэна и модели R1

20 января 2025 года мир технологий испытал тектонический сдвиг: китайская лаборатория DeepSeek выпустила модель R1, которая не только сравнялась по возможностям рассуждения с лидерами западного рынка, но и сделала это за долю от их стоимости. За этим успехом стоит фигура миллиардера Лян Вэньфэна, чья стратегия эффективности и открытости поставила под сомнение доминирование Кремниевой долины.

🚀 Прорыв, которого не должно было случиться 0:00

До недавнего времени считалось, что Запад обладает недосягаемым преимуществом в гонке ИИ . Исследования становились всё дороже, а компании вроде OpenAI закрывали свои наработки за «завесой коммерческой тайны». DeepSeek R1 разрушила этот сценарий. Модель оказалась невероятно дешевой в обучении, конкурентоспособной и, что важнее всего, доступной для скачивания (open weights) .

Реакция западных гигантов была мгновенной:

OpenAI в марте признали, что их преимущество «не является широким и сокращается» .
Представители OpenAI даже призвали запретить модели вроде R1, утверждая, что компания может быть подконтрольна государству и представлять угрозу безопасности .
В то же время DeepSeek уже готовит следующий удар — выпуск модели R2, ожидаемый в ближайшие месяцы .

👤 Лян Вэньфэн: миллиардер, который прячется от толпы 1:52

Основатель DeepSeek Лян Вэньфэн — фигура крайне скрытная. На фоне успеха он столкнулся с таким вниманием в родном городе, что ему пришлось практически бежать из провинции вместе с семьей, чтобы скрыться от толп поклонников .

Лян — выходец из мира финансов. Он окончил университет в 2008 году, в разгар мирового финансового кризиса, что сформировало его стремление понимать хаос через паттерны .

В 2010 году получил степень магистра в области информационных технологий .
В 2016 году основал хедж-фонд Highflyer, который использовал машинное обучение для сверхбыстрой торговли .
К 2021 году под управлением фонда было $9,4 млрд, а Лян стал миллиардером к 35 годам .

По словам одного из партнеров, при первой встрече Лян выглядел как «типичный ботаник с ужасной прической», который грезил о кластере из 10 000 чипов — тогда его слова мало кто воспринимал всерьез .

💡 Технологическое чудо на «багаже» Highflyer 6:03

Путь к DeepSeek начался с уроков, извлеченных из ошибок в хедж-фонде. ИИ-система Highflyer оказалась слишком азартной, что привело к убыткам и публичным извинениям фонда в 2021 году . В апреле 2023 года Лян создал DeepSeek как исследовательскую организацию, движимую чистым любопытством, а не жаждой наживы .

Лян осознанно выбрал стратегию, идущую вразрез с западной:

Приоритет талантам, а не дипломам: В команду набирали молодых выпускников, часто игнорируя даже тех, кто вернулся с обучения на Западе .
Отсутствие KPI: Исследователям дали полную свободу совершать ошибки и экспериментировать без давления планов продаж .
Игнорирование бенчмарков: DeepSeek намеренно исключала вопросы с множественным выбором из обучения, чтобы модель реально «умнела», а не просто подстраивалась под тесты .

🛠 Магия эффективности: как обойти санкции и нехватку чипов 14:33

Успех DeepSeek R1 — это не результат вливания бесконечных денег, а цепочка инженерных инноваций, продиктованная необходимостью. Из-за ограничений США на поставку чипов (Nvidia A100/H100) китайским компаниям пришлось буквально выжимать максимум из имеющегося оборудования . Порой графические процессоры даже ввозились в страну контрабандой в чемоданах .

Ключевые технические прорывы:

DeepSeek MoE (Mixture of Experts): В отличие от стандартных моделей, здесь активируется только нужная часть весов («экспертов») для ответа . Инновация Ляна заключалась в создании «общих» экспертов, которые активны всегда, позволяя специализированным сегментам (как форварду в футболе) не отвлекаться на базовые задачи .
GRPO (Group Relative Policy Optimization): Новый метод обучения с подкреплением, который отказался от тяжелых «критических моделей» в пользу параллельной генерации ответов и их сравнительной оценки . Это позволило радикально сэкономить память видеокарт.
Multi-head Latent Attention: Механизм, позволяющий разным частям модели совместно использовать скрытые веса, что делает модель компактнее при сохранении интеллекта .

🔎 Феномен R1: почему OpenAI занервничали 21:00

Лян Вэньфэн открыто заявлял, что Китаю пора перестать быть «безбилетником», использующим западные инновации, и стать контрибьютором . В конце 2024 года DeepSeek V3 уже заставила западные лаборатории внимательно изучать китайский код. Генеральный директор Anthropic Дарио Амодеи признал, что V3 стала настоящим технологическим прорывом .

DeepSeek R1 пошла еще дальше, внедрив метод «мыслей вслух» (chain of thought).

Модель сначала рассуждает про себя, прежде чем выдать ответ .
Мир увидел процесс «ага-моментов», когда ИИ возвращается назад и исправляет свои же ошибки в логике .
Согласно некоторым тестам, R1 превзошла модель o1 от OpenAI в математике и кодинге .

OpenAI попытались обвинить DeepSeek в «дистилляции» (краже интеллекта через копирование ответов их модели), но эти обвинения не нашли широкой поддержки, учитывая, что сами OpenAI судятся со множеством правообладателей за использование их данных .

🔮 Будущее: тупик или путь к AGI? 27:53

Несмотря на триумф, перед DeepSeek стоят огромные вызовы. Дарио Амодеи считает, что текущий успех китайцев — временный. По его мнению, для достижения Истинного Общего Интеллекта (AGI) понадобятся десятки миллиардов долларов и миллионы чипов, которые невозможно ввезти контрабандой . Он прогнозирует, что разрыв между теми, кто может тратить $10–100 млрд на обучение (Microsoft, Google), и остальными снова вырастет в 2026–2027 годах .

Однако DeepSeek не планирует останавливаться. В научной статье по R1 есть намеки на разработку «бесконечного контекста» и замену архитектуры Transformer, которая является стандартом индустрии .

Если Лян Вэньфэн прав и AGI действительно находится в 2, 5 или 10 годах от нас , то история DeepSeek — это не просто успех одной компании, это сигнал о том, что эпоха автоматизированного интеллекта уже наступила, и правила игры в ней меняются прямо сейчас.