AI Explained: «OpenAI — не бог, а лидерство Запада в ИИ стремительно тает»

AI Explained 108 тыс. 34 мин 4 мин 27.04.2025
Главное

«OpenAI — не бог»: документальная история DeepSeek, Лян Вэньфэна и модели R1

20 января 2025 года мир технологий испытал тектонический сдвиг: китайская лаборатория DeepSeek выпустила модель R1, которая не только сравнялась по возможностям рассуждения с лидерами западного рынка, но и сделала это за долю от их стоимости. За этим успехом стоит фигура миллиардера Лян Вэньфэна, чья стратегия эффективности и открытости поставила под сомнение доминирование Кремниевой долины.

🚀 Прорыв, которого не должно было случиться 0:00

До недавнего времени считалось, что Запад обладает недосягаемым преимуществом в гонке ИИ . Исследования становились всё дороже, а компании вроде OpenAI закрывали свои наработки за «завесой коммерческой тайны». DeepSeek R1 разрушила этот сценарий. Модель оказалась невероятно дешевой в обучении, конкурентоспособной и, что важнее всего, доступной для скачивания (open weights) .

Реакция западных гигантов была мгновенной:

👤 Лян Вэньфэн: миллиардер, который прячется от толпы 1:52

Основатель DeepSeek Лян Вэньфэн — фигура крайне скрытная. На фоне успеха он столкнулся с таким вниманием в родном городе, что ему пришлось практически бежать из провинции вместе с семьей, чтобы скрыться от толп поклонников .

Лян — выходец из мира финансов. Он окончил университет в 2008 году, в разгар мирового финансового кризиса, что сформировало его стремление понимать хаос через паттерны .

По словам одного из партнеров, при первой встрече Лян выглядел как «типичный ботаник с ужасной прической», который грезил о кластере из 10 000 чипов — тогда его слова мало кто воспринимал всерьез .

💡 Технологическое чудо на «багаже» Highflyer 6:03

Путь к DeepSeek начался с уроков, извлеченных из ошибок в хедж-фонде. ИИ-система Highflyer оказалась слишком азартной, что привело к убыткам и публичным извинениям фонда в 2021 году . В апреле 2023 года Лян создал DeepSeek как исследовательскую организацию, движимую чистым любопытством, а не жаждой наживы .

Лян осознанно выбрал стратегию, идущую вразрез с западной:

  1. Приоритет талантам, а не дипломам: В команду набирали молодых выпускников, часто игнорируя даже тех, кто вернулся с обучения на Западе .
  2. Отсутствие KPI: Исследователям дали полную свободу совершать ошибки и экспериментировать без давления планов продаж .
  3. Игнорирование бенчмарков: DeepSeek намеренно исключала вопросы с множественным выбором из обучения, чтобы модель реально «умнела», а не просто подстраивалась под тесты .

🛠 Магия эффективности: как обойти санкции и нехватку чипов 14:33

Успех DeepSeek R1 — это не результат вливания бесконечных денег, а цепочка инженерных инноваций, продиктованная необходимостью. Из-за ограничений США на поставку чипов (Nvidia A100/H100) китайским компаниям пришлось буквально выжимать максимум из имеющегося оборудования . Порой графические процессоры даже ввозились в страну контрабандой в чемоданах .

Ключевые технические прорывы:

🔎 Феномен R1: почему OpenAI занервничали 21:00

Лян Вэньфэн открыто заявлял, что Китаю пора перестать быть «безбилетником», использующим западные инновации, и стать контрибьютором . В конце 2024 года DeepSeek V3 уже заставила западные лаборатории внимательно изучать китайский код. Генеральный директор Anthropic Дарио Амодеи признал, что V3 стала настоящим технологическим прорывом .

DeepSeek R1 пошла еще дальше, внедрив метод «мыслей вслух» (chain of thought).

OpenAI попытались обвинить DeepSeek в «дистилляции» (краже интеллекта через копирование ответов их модели), но эти обвинения не нашли широкой поддержки, учитывая, что сами OpenAI судятся со множеством правообладателей за использование их данных .

🔮 Будущее: тупик или путь к AGI? 27:53

Несмотря на триумф, перед DeepSeek стоят огромные вызовы. Дарио Амодеи считает, что текущий успех китайцев — временный. По его мнению, для достижения Истинного Общего Интеллекта (AGI) понадобятся десятки миллиардов долларов и миллионы чипов, которые невозможно ввезти контрабандой . Он прогнозирует, что разрыв между теми, кто может тратить $10–100 млрд на обучение (Microsoft, Google), и остальными снова вырастет в 2026–2027 годах .

Однако DeepSeek не планирует останавливаться. В научной статье по R1 есть намеки на разработку «бесконечного контекста» и замену архитектуры Transformer, которая является стандартом индустрии .

Если Лян Вэньфэн прав и AGI действительно находится в 2, 5 или 10 годах от нас , то история DeepSeek — это не просто успех одной компании, это сигнал о том, что эпоха автоматизированного интеллекта уже наступила, и правила игры в ней меняются прямо сейчас.

💬 Цитаты

«OpenAI — не бог. Люди думают, что за DeepSeek стоит некая скрытая бизнес-логика, но на самом деле нами движет любопытство.»

Лян Вэньфэн 08:44

«Я считаю, что конкурировать с нами в обучении базовых моделей совершенно безнадежно, но ваша работа — всё равно пытаться.»

Сэм Альтман 11:12

«Китай должен постепенно стать контрибьютором, а не просто пользоваться чужими инновациями.»

Лян Вэньфэн 21:13
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Open Weights
Модель, чьи веса (числовые параметры) доступны для скачивания и локального запуска, но данные обучения могут быть скрыты.
Mixture of Experts (MoE)
Архитектура, в которой для каждого запроса активируется только небольшая часть нейронов, что повышает скорость и снижает затраты.
Chain of Thought
Метод, заставляющий ИИ генерировать промежуточные шаги рассуждения перед выдачей финального ответа.
Distillation
Процесс обучения маленькой модели на ответах более мощной и умной нейросети.
📊 Цифры
🗓 Хронология
  1. 2008 Лян Вэньфэн заканчивает университет в разгар финансового кризиса.
  2. Февраль 2016 Основание квантового хедж-фонда Highflyer.
  3. Апрель 2023 Создание DeepSeek как исследовательской лаборатории.
  4. Ноябрь 2023 Релиз первой версии моделей DeepSeek V1 и DeepSeek Coder.
  5. 20 января 2025 Официальный выпуск DeepSeek R1, вызвавший панику на рынках.
⚖️ Другая сторона
Искусственный интеллект DeepSeek Лян Вэньфэн OpenAI Highflyer R1