Мир искусственного интеллекта переживает тектонический сдвиг: открытое программное обеспечение (Open Source) начинает всерьез угрожать доминированию технологических гигантов. Главными драйверами этой трансформации стали новые разработки из Китая — видеомодель Wan 2.1 от Alibaba и анонсированный преемник нашумевшей нейросети DeepSeek R1.
🎥 Wan 2.1: Голливуд на домашнем ПК 0:24
Компания Alibaba официально представила Wan 2.1 — новейшее семейство моделей для генерации видео с открытым исходным кодом . Модель доступна для академического и коммерческого использования, а ее веса уже размещены на платформе Hugging Face, что позволяет любому желающему запустить нейросеть локально .
Особый интерес представляет компактная версия модели T2V-1.3B. По словам ведущего Уэса Рота, она способна работать на потребительских видеокартах с объемом видеопамяти от 8,19 ГБ . В качестве примера приводится видеокарта Nvidia RTX 4090: на ней создание пятисекундного ролика в разрешении 480p занимает чуть менее четырех минут . Хотя это нельзя назвать «молниеносной» скоростью, сам факт запуска такой технологии на домашнем оборудовании открывает огромные возможности для художников и малого бизнеса .
Возможности Wan 2.1 включают:
- Генерацию видео по текстовому описанию (Text-to-Video).
- Анимацию статичных изображений (Image-to-Video) .
- Высокое качество визуализации сложных объектов: от реалистичного движения поездов до детализированных аниме-сцен .
- В перспективе ожидается добавление функций генерации аудио к видео и редактирования видео с помощью ИИ .
🧠 DeepSeek R2: Возвращение «убийцы» рынка 1:31
Китайская лаборатория DeepSeek, чья предыдущая модель R1 в начале 2025 года вызвала обвал акций технологических компаний США, готовится к выпуску следующего поколения — R2 . Изначально релиз планировался на май, однако, по данным инсайдеров Reuters, компания стремится выпустить модель как можно скорее .
Ожидается, что DeepSeek R2 предложит значительные улучшения:
- Повышенное качество написания программного кода .
- Способность к рассуждению (reasoning) на множестве языков помимо английского .
- Сохранение высокой эффективности при использовании меньших вычислительных мощностей по сравнению с западными аналогами .
По мнению генерального директора индийской ИТ-компании Zensar, запуск DeepSeek R2 может стать поворотным моментом в истории ИИ . Он утверждает, что успех DeepSeek в создании экономически эффективных и открытых моделей заставит компании по всему миру ускорить собственные разработки, разрушая монополию нескольких доминирующих игроков .
💣 Экономика «выжженной земли» 3:15
Уэс Рот характеризует стратегию DeepSeek как политику «выжженной земли» в отношении американских ИИ-гигантов . Пока OpenAI и Google тратят миллиарды долларов на инфраструктуру и дата-центры, небольшая китайская компания выпускает продукт, который на 90% соответствует их возможностям, но при этом доступен бесплатно для скачивания и локального запуска .
Ключевые преимущества открытой модели, по мнению Рота:
- Автономность: модель живет на вашем компьютере, а не на сервере корпорации .
- Отсутствие ограничений: копии можно распространять и использовать бесконечно .
- Дистилляция знаний: на основе большой модели можно обучать маленькие специализированные версии для конкретных задач .
Ценовая политика DeepSeek также вызывает шок в индустрии. Согласно данным Business Insider, существует колоссальная разница в стоимости использования API DeepSeek и аналогичных моделей от OpenAI . Хотя представители OpenAI, в частности Адам GPT, указывают на возможные неточности в расчетах маржинальности (заявляя, что реальная чистая прибыль DeepSeek ближе к 84%, а не к фантастическим цифрам из соцсетей), экономическая привлекательность китайского решения остается беспрецедентной .
🛡️ Геополитика и «чиповая война» 4:23
Взрывной рост популярности китайских технологий вызывает серьезное беспокойство в Вашингтоне. В США звучат предложения о введении суровых мер наказания: по словам Рота, некоторые сенаторы предлагают до 20 лет тюремного заключения за скачивание DeepSeek, аргументируя это связями компании с военно-социальным аппаратом КПК .
Острым вопросом остается доступ DeepSeek к оборудованию. Генеральный директор Scale AI Александр Ван утверждает, что у DeepSeek гораздо больше чипов, чем им положено иметь в условиях экспортных ограничений США . Существует мнение, что компания использует «запрещенные» чипы Nvidia, полученные в обход санкций .
Однако ведущий отмечает, что именно дефицит вычислительных мощностей заставил китайских инженеров изобретать новые методы оптимизации и эффективности . Хотя некоторые идеи были заимствованы из западных исследований, DeepSeek внесла значительный инновационный вклад, который теперь, по иронии судьбы, могут начать использовать сами американские компании .
📈 Феноменальный рост и примеры работы 7:50
Популярность DeepSeek бьет все рекорды. Приложению компании потребовалось всего 7 дней, чтобы набрать 100 миллионов пользователей . Для сравнения: ChatGPT и TikTok шли к этому показателю значительно дольше . Несмотря на то, что значительная часть аудитории приходится на Китай, масштаб глобального влияния технологии невозможно игнорировать .
Завершая обзор, Уэс Рот демонстрирует возможности модели Wan 2.1 на конкретных примерах:
- Реалистичные движения животных (жирафы, Crow/Raven) .
- Сюрреалистичные и забавные сцены: тигр, выполняющий трюки на велосипеде BMX .
- Сложная динамика жидкостей: женщина, выходящая из воды .
- Высококачественная анимация в стиле аниме с плавной физикой движений .
Хотя ведущий признает, что демонстрационные ролики могли подвергаться постобработке и тщательному отбору («человеческий интеллект был добавлен при монтаже»), текущий уровень открытых технологий выглядит впечатляюще и обещает радикально изменить рынок ИИ в ближайшем будущем .