Как запуск китайской нейросети DeepSeek изменил мировую индустрию ИИ

varlamov 887 тыс. 38 мин 7 мин 01.02.2025
Главное

Выход новой китайской нейросети DeepSeek спровоцировал масштабный тектонический сдвиг в мировой индустрии искусственного интеллекта и вызвал панику на американском фондовом рынке. Ведущий канала Илья Варламов вместе с российскими ИИ-экспертами Александром Крайновым и Ильёй Бойцовым разбирается, действительно ли проект из КНР способен стать «убийцей» ChatGPT, в чём уникальность его архитектуры и как скромный бюджет разработки пошатнул монополию технологических гигантов Кремниевой долины.

🌍 Китайский вызов: как DeepSeek всколыхнул мировой рынок 0:00

В конце января американские биржи зафиксировали рекордное падение технологического сектора, спровоцированное официальным релизом китайского чат-бота DeepSeek. Буквально за один день индекс NASDAQ упал на 3%, что повлекло за собой совокупную потерю капитализации высокотехнологичных компаний почти на триллион долларов. Наибольший удар пришёлся на лидера полупроводниковой индустрии — компанию NVIDIA, чьи акции рухнули сразу на 17%, лишив её более 600 миллиардов долларов рыночной стоимости. Паника также затронула таких ИТ-гигантов, как Microsoft (падение на 5%) и Oracle (минус 13%), и даже перекинулась на азиатские рынки, где японский холдинг SoftBank потерял около 13% стоимости за два дня.

По оценкам западных деловых медиа, появление DeepSeek стало переломным моментом, который вынуждает лидеров рынка кардинально пересмотреть свои стратегии развития. В социальных сетях запуск нейросети вызвал волну мемов, обыгрывающих её логотип в виде синего кита и жесткую китайскую государственную цензуру. Однако для профессионального сообщества ситуация выглядит гораздо серьезнее.

Директор по развитию технологий искусственного интеллекта в Яндексе Александр Крайнов проводит аналогию между развитием современных больших языковых моделей (LLM) и появлением персональных компьютеров или интернета в конце XX века. По его мнению, ИИ-модели станут абсолютно незаменимым слоем инфраструктуры для любой сферы человеческой деятельности, где требуется обработка текстовой информации.

🛠️ Что такое DeepSeek и технические секреты его эффективности 7:31

С точки зрения пользователя, DeepSeek предлагает стандартный для современных чат-ботов интерфейс, доступный как через веб-браузер, так и в виде мобильных приложений. Платформа поддерживает более 20 языков, включая русский, и, в отличие от американского конкурента ChatGPT, официально и без ограничений работает на территории России, не требуя иностранных сим-карт или подмены IP-адресов.

У чат-бота есть два ключевых режима работы:

Главная технологическая сенсация скрывается в архитектуре базовой модели DeepSeek V3, на которой построен продвинутый рассуждающий алгоритм R1. Модель оперирует 671 миллиардом параметров и обучена на огромном массиве данных объёмом 14 триллионов токенов. При этом китайские инженеры смогли реализовать внушительное контекстное окно размером в 128 000 токенов, что в четыре раза превышает базовые возможности стандартной версии GPT-4.

Как объясняет эксперт в области ИИ Илья Бойцов, 핵심 инновацией DeepSeek стало широкое внедрение алгоритмов обучения с подкреплением (Reinforcement Learning). Разработчики применили уникальный метод оптимизации GRPO (Group Relative Policy Optimization) и существенно переработали классический механизм внимания (Attention Mechanism). По словам эксперта, это позволило нейросети осуществлять скрытые промежуточные вычисления, верифицировать и самостоятельно корректировать ход своих мыслей перед выдачей финального ответа.

💰 Революция копеечных затрат против американских миллиардов 12:00

Наибольший шок у инвесторов Кремниевой долины вызвало соотношение цены и качества разработки DeepSeek. Согласно официальной технической документации стартапа, финальный прогон и обучение флагманской модели V3 заняли всего два месяца и обошлись компании в скромные 5–6 миллионов долларов. Для сравнения, по имеющимся оценкам, американская OpenAI потратила на обучение GPT-4 более 100 миллионов долларов.

Илья Бойцов уточняет, что реальная стоимость проекта с учётом всех предыдущих неудачных экспериментов, зарплат штата исследователей и проверки гипотез определенно выше заявленных шести миллионов. Тем не менее, итоговые затраты китайской стороны оказались в разы ниже бюджетов западных конкурентов.

Экономия ресурсов затронула и аппаратную часть:

Именно этот факт обрушил котировки NVIDIA. До релиза DeepSeek на рынке доминировало убеждение, что создавать сильный ИИ способны лишь единичные ИТ-гиганты с неограниченными бюджетами, закупающие чипы десятками тысяч. Китайский стартап доказал, что математическая оптимизация и изящная архитектура кодинга могут компенсировать дефицит дорогого железа.

⚖️ Реальные возможности, галлюцинации и скандалы вокруг проекта 21:30

Несмотря на громкий успех, эксперты призывают не идеализировать DeepSeek и указывают на ряд существенных ограничений. В ходе независимых тестов, проведенных журналистами Wall Street Journal на базе американского школьного экзамена по математике (AIME), американская модель от OpenAI справлялась с задачами ощутимо быстрее — за 10 секунд против двух минут у китайского конкурента.

Обозреватели также отмечают, что DeepSeek R1 пока уступает по общему функционалу: у модели отсутствует долгосрочная память разговоров, и она подвержена стандартной проблеме всех современных LLM — «галлюцинациям», когда алгоритм уверенно выдумывает несуществующие факты, вместо того чтобы признать отсутствие знаний. Кроме того, вскрылся курьёзный факт: в процессе сбора обучающего датасета китайский ИИ активно тренировали на текстах, сгенерированных моделями OpenAI. В результате во время первых тестов DeepSeek V3 в некоторых диалогах ошибочно идентифицировал себя как ChatGPT.

Запуск проекта сопровождался и крупными международными скандалами:

С другой стороны, неоспоримым преимуществом DeepSeek является её открытость. Разработчики выложили исходный код модели в открытый доступ (open-source). Это позволяет исследователям и компаниям по всему миру скачивать её и запускать локально на собственных серверах, гарантируя полную конфиденциальность данных, которые больше не нужно отправлять на внешние сервера.

🏢 Паника в Кремниевой долине и жесткий ответ США 27:06

Западная ИТ-индустрия отреагировала на успех DeepSeek в режиме экстренной мобилизации. Руководитель Meta Марк Цукерберг сформировал четыре оперативных штаба быстрого реагирования из ведущих разработчиков, чтобы понять, как китайская команда создала технологию, превосходящую по ряду параметров их собственную модель Meta AI и готовящуюся к выходу Llama 3. Внутренние отчеты компании свидетельствуют, что американские инженеры признают технологическое превосходство DeepSeek над многими перспективными разработками США.

В американской прессе феномен DeepSeek уже окрестили «моментом Спутника» (Sputnik Moment), проводя прямую историческую параллель с 1957 годом, когда запуск советского космического аппарата заставил США осознать своё научно-технологическое отставание и экстренно реформировать всю систему оборонных разработок.

Ответом со стороны американского руководства и крупного бизнеса стало форсирование масштабного национального проекта Stargate («Звёздные врата»), инициированного Дональдом Трампом совместно с OpenAI, SoftBank и Oracle. Проект предусматривает беспрецедентные инвестиции: 100 миллиардов долларов на первом этапе и до 600 миллиардов долларов в общей сложности в течение четырёх лет. Цель консорциума — покрыть всю территорию США сетью суперсовременных дата-центров и физической ИИ-инфраструктуры, чтобы гарантировать стратегическое превосходство Америки в технологической гонке.

🇨🇳 Стратегия Пекина: от систем слежки к мировому лидерству к 2030 году 32:31

DeepSeek — далеко не единственный представитель бурно развивающегося ИИ-рынка Китая. Сразу после его релиза технологический гигант Alibaba анонсировал свою модель Qwen 2.5 Max, обученную на 20 триллионах токенов и демонстрирующую превосходство в понимании естественного языка и программировании. На внутреннем рынке КНР также активно развиваются:

Успех китайских компаний обусловлен системной государственной политикой. Пекин запустил национальную программу развития ИИ ещё в 2006 году, а в 2017 году Госсовет КНР утвердил стратегический план по достижению мирового лидерства в индустрии к 2030 году, жестко закрепив за каждой корпорацией её технологическое направление. Государство сознательно создаёт для своих разработчиков тепличные условия, минимизируя регуляторные барьеры внутри страны. Это выгодно отличает Китай от Евросоюза, где жесткое запретительное регулирование фактически выжгло собственную технологическую почву, лишив Европу сильных игроков в ИИ-гонке.

Единственной уязвимостью и «ахиллесовой пятой» китайского ИИ эксперты называют тотальную внутреннюю цензуру и ограничение свободы слова. Необходимость жестко фильтровать ответы нейросетей в соответствии с идеологическими рамками Компартии неизбежно сдерживает чистые инновации и существенно усложняет экспансию китайских ИТ-продуктов на глобальном международном рынке.

💬 Цитаты

«ПК доказала что можно потратить относительно немного денег и построить модель которая будет сравнима по качеству с лидерами индустрии»

Илья Варламов 12:25

«Большие языковые модели — это будет не то что в каком-то месте улучшили, это вот опять же как интернет, персональные компьютеры, это будет незаменимая часть почти для всего»

Александр Крайнов 4:38
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Токен
Часть слова или слог, базовый текстовый элемент, на котором обучается и которым оперирует нейросеть.
Контекстное окно
Объём данных (памяти), который ИИ-модель способна удерживать и обрабатывать за один рабочий запрос.
GRPO
Group Relative Policy Optimization — алгоритм обучения модели с подкреплением, снижающий затраты на вычисления.
Open-source
Программное обеспечение с открытым исходным кодом, доступное для изменения и локального использования любыми разработчиками.
📊 Цифры
🗓 Хронология
  1. 2006 год Правительство КНР запускает первую национальную программу развития искусственного интеллекта.
  2. 2017 год Госсовет Китая утверждает план достижения мирового лидерства в сфере ИИ к 2030 году.
  3. Май 2023 года Предприниматель Лян Вэньфэн основывает ИИ-стартап DeepSeek под эгидой хэдж-фонда HighFlyer.
  4. Конец декабря 2024 года Официальный релиз генеративной большой языковой модели DeepSeek V3.
  5. Январь 2025 года Выход рассуждающей модели DeepSeek R1 и массовый обвал акций технологического сектора США.
⚖️ Другая сторона
Искусственный интеллект DeepSeek ChatGPT OpenAI Илья Варламов