Уэс Рот: «DeepSeek разрушает монополию OpenAI, используя их же данные»

Wes Roth 163 тыс. 12 мин 4 мин 30.05.2025
Главное

Компания DeepSeek представила масштабное обновление своей модели R1 (версия от 28 мая 2025 года), которое, по мнению автора канала Уэса Рота, кардинально меняет правила игры в индустрии искусственного интеллекта. Новая итерация не только вплотную приблизилась к лидерам рынка от OpenAI и Google по ключевым бенчмаркам, но и спровоцировала дискуссию о методах обучения китайских нейросетей и их влиянии на бизнес-модели западных технологических гигантов.

🚀 Прыжок в лидеры: Новые возможности DeepSeek R1 0:00

Новая версия DeepSeek R1, выпущенная 28 мая 2025 года, продемонстрировала значительный скачок в производительности по сравнению с моделью начала года . Уэс Рот отмечает, что хотя многие ожидали полноценного релиза R2, данное обновление фактически вывело текущую модель в один ряд с самыми мощными ИИ в мире .

Согласно представленным данным и тестам:

По словам ведущего, это «большое событие», так как открытая модель (open-source) теперь предлагает возможности, сопоставимые с проприетарными гигантами, что ставит под вопрос эксклюзивность закрытых систем .

🕵️ ИИ-криминалистика: Секрет быстрого обучения 1:47

Одним из самых интригующих моментов обсуждения стало исследование Сэма П. (Sam P.), автора проекта EQBench. Он применил методы биоинформатики для анализа «генеалогического древа» языковых моделей, изучая так называемый «slop profile» — характерные особенности и паттерны выдачи ИИ .

Суть теории Сэма П. заключается в следующем:

  1. Каждая модель имеет свои «лингвистические привычки» (например, модели GPT любят слова delve или tapestry) .
  2. Анализ первой версии DeepSeek R1 показал её сходство с архитектурой и паттернами OpenAI o3 .
  3. Однако обновленная версия от 28 мая демонстрирует явный сдвиг в сторону технологий Google. По мнению исследователя, она имеет профиль, очень похожий на Gemini 2.5 Pro Experimental .

На основании этих данных Сэм П. и Уэс Рот предполагают, что разработчики DeepSeek перешли от обучения на синтетических данных OpenAI к использованию синтетических данных из Gemini . Этот процесс, известный как «дистилляция знаний» (knowledge distillation), является, по словам Рота, «секретом полишинеля» в индустрии: компании обучают свои нейросети на ответах уже существующих сильных моделей . Иногда это приводит к курьезам, когда сторонний ИИ вдруг заявляет, что он разработан в OpenAI, потому что перенял эти убеждения из обучающей выборки .

💸 Экономический удар по Кремниевой долине 5:56

Успех DeepSeek может иметь серьезные экономические последствия для западных ИИ-лабораторий. Уэс Рот цитирует предпринимателя Баладжи Сринивасана, который предсказывает «блицкриг» китайских open-source моделей во всех сферах — от компьютерного зрения до робототехники .

Ключевые экономические тезисы дискуссии:

Основатель DeepSeek Лян (Liang) утверждает, что «рвы» (конкурентные преимущества), созданные закрытым исходным кодом, временны . По его мнению, единственным настоящим «рвом» является команда и культура инноваций, поэтому компания намерена придерживаться стратегии открытого кода .

🌎 Геополитика и «Манхэттенский проект» ИИ 8:53

Противостояние в сфере ИИ всё чаще принимает форму государственного соперничества. Министерство энергетики США уже открыто называет ИИ «следующим Манхэттенским проектом» и заявляет о намерении Соединенных Штатов победить в этой гонке .

В рамках этого противостояния:

При этом доктор Джим Фан из Nvidia отмечает парадоксальную ситуацию: по его мнению, DeepSeek фактически продолжает изначальную миссию OpenAI, публикуя по-настоящему открытые передовые исследования .

🛡️ Скрытые мотивы и безопасность 11:09

Уэс Рот призывает критически относиться к риторике лидеров Кремниевой долины. Он задается вопросом: продиктованы ли их предупреждения об опасности Китая заботой о безопасности ИИ или же это попытка устранить конкурентов? . Если правительство будет напугано угрозой со стороны КНР, оно может ввести ограничения на экспорт чипов и другие меры, которые затруднят жизнь open-source проектам и облегчат доминирование крупным корпорациям США .

Тем не менее, автор подчеркивает, что развитие ИИ стало экзистенциальным вопросом для целых наций . Ситуация, когда несколько лабораторий в районе залива Сан-Франциско единолично разрабатывают сверхразум, невозможна — остальной мир не будет просто наблюдать со стороны . Битва за технологическое лидерство только начинается.

💬 Цитаты

«В условиях разрушительных технологий «рвы», созданные закрытым исходным кодом, временны.»

Лян (основатель DeepSeek) 08:25

«ИИ — это следующий Манхэттенский проект, и Соединенные Штаты победят.»

Министерство энергетики США 05:17

«DeepSeek фактически поддерживает жизнь изначальной миссии OpenAI — по-настоящему открытые фронтирные исследования.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Дистилляция знаний (Knowledge Distillation)
Метод обучения меньшей или более дешевой модели на ответах более мощной «учительской» модели.
Open-source модель
Модель ИИ с открытыми весами, которую любой желающий может запустить на своем оборудовании.
Slop profile
Уникальный набор лингвистических паттернов и часто повторяющихся слов, характерный для конкретной нейросети.
📊 Цифры
🗓 Хронология
  1. январь 2025 Выход ранней версии модели DeepSeek R1.
  2. 28 мая 2025 Релиз обновленной модели R1 (0528), догнавшей лидеров рынка.
  3. май 2025 Публикация анализа EQBench, раскрывшая вероятные источники данных для обучения DeepSeek.
⚖️ Другая сторона
Искусственный интеллект DeepSeek OpenAI Gemini Уэс Рот knowledge distillation