ИИ-новости от Уэса Рота: почему 2025 год станет эрой роботов и как SSI достигла оценки в $20 млрд

Wes Roth 92,2 тыс. 17 мин 5 мин 11.02.2025
Главное

Технологии искусственного интеллекта продолжают развиваться с ошеломляющей скоростью, стирая границы между виртуальным и реальным мирами. В свежем обзоре ИИ-энтузиаст и автор канала Уэс Рот (Wes Roth) анализирует последние достижения в области робототехники, генерации видео и автономных систем. Основное внимание уделено новым методам обучения роботов от NVIDIA и Apple, прорывам китайских разработчиков в создании реалистичных аватаров и стремительному росту капитализации компании Ильи Суцкевера Safe Superintelligence (SSI).

🤖 Робототехника: от атлетизма до домашних компаньонов 0:00

Исследователи из Университета Карнеги — Меллон (CMU) в сотрудничестве с NVIDIA представили ASAP — двухэтапную платформу для обучения гибкости гуманоидных роботов . Система сначала обучается на человеческих данных, а затем корректирует движения в реальном мире с помощью «модели дельта-действий», которая устраняет несоответствия между симуляцией и реальностью .

Демонстрация возможностей ASAP включает:

Уэс Рот отмечает, что после тонкой настройки ASAP движения роботов становятся значительно более плавными и скоординированными .

Параллельно с этим Meta развивает проект Partner — открытую платформу для создания домашних роботов-компаньонов . По задумке разработчиков, такой робот сможет следовать за владельцем, выполнять команды и взаимодействовать с виртуальной реальностью. Одной из ключевых частей экосистемы стала Habitat 3.0 — 3D-симуляция, напоминающая игру The Sims, но предназначенная для обучения ИИ в реалистичных интерьерах со сканами реальных домов и сотнями тысяч объектов . По мнению автора, 2025 год станет «годом роботов» в индустрии ИИ .

🎬 Прорыв в ИИ-видео: ByteDance и Luma AI 3:00

Компания ByteDance (владелец TikTok) выпустила модель OmniHuman-1, которая специализируется на создании гиперреалистичных видео с людьми на основе одного изображения .

Ключевые особенности OmniHuman-1:

Уэс Рот проводит аналогию с моделями DeepSeek, отмечая, что ограничение вычислительных мощностей (compute) в Китае часто становится «матерью изобретательности», заставляя разработчиков создавать более эффективные алгоритмы, чем в США . OmniHuman-1 способна анимировать не только фотографии, но и мультфильмы, стилизованных персонажей и даже антропоморфные объекты .

Другой крупный игрок, Luma AI, представил Ray 2 — обновленную версию своей видеомодели . По заявлениям разработчиков, Ray 2 обеспечивает естественное движение, реалистичную физику и беспрецедентную связность кадров (coherence) . Ведущий демонстрирует возможности модели на примере оживления классической живописи, исторических артефактов и мемов .

В ходе демонстрации Рот упоминает печальный факт: Кабосу, собака породы сиба-ину, ставшая лицом мема Doge, скончалась в 2024 году. Он в шутку замечает, что не хотел страдать от этой новости в одиночку и решил поделиться ею со зрителями .

🍏 Apple и «элегантные» роботы 7:25

Инженеры Apple работают над проектом под названием Elegant. Это концепция робототехники, сфокусированная не на гуманоидах, а на наделении повседневных предметов (например, настольных ламп) «характером» и экспрессией .

Принципы Elegant включают:

Уэс Рот выражает опасение, что излишняя эмоциональность может быстро начать раздражать в быту, и предлагает Apple добавить режим «поторопись и просто сделай свою работу» для опытных пользователей .

Вторым важным анонсом от Apple стала публикация статьи «Robust autonomy emerges from self-play» . Исследователи создали Giga flow — масштабную симуляцию города (похожую на GTA), где 40 000 агентов (автомобилей, грузовиков, пешеходов) обучаются вождению методом самообучения (self-play) .

Масштабы Giga flow:

Удивительно, но по словам автора, агенты, обучавшиеся исключительно в симуляции без использования данных о вождении реальных людей, превзошли современные аналоги (SOTA) при тестировании в реальных сценариях . Это подтверждает тренд, заданный моделями AlphaGo Zero и DeepSeek R1: обучение через подкрепление (reinforcement learning) и самообучение часто оказываются эффективнее слепого копирования человеческих данных .

💰 Safe Superintelligence (SSI): оценка в $20 миллиардов 13:00

Компания Safe Superintelligence (SSI), основанная бывшим сооснователем OpenAI Ильей Суцкевером, продемонстрировала феноменальный рост капитализации. По имеющимся данным, компания сейчас оценивается в $20 миллиардов, что в четыре раза превышает её сентябрьскую оценку в $5 миллиардов .

В раунде финансирования участвовали такие гиганты, как Sequoia Capital, Andreessen Horowitz и DST Global . Примечательно, что SSI:

В то время как OpenAI и Anthropic смещают фокус на коммерциализацию (выручка OpenAI в прошлом году составила почти $4 млрд), Суцкевер предпочитает секретность, называя свой проект «новой горой, на которую предстоит взобраться» .

🎨 Новые инструменты редактирования: Pika и Kling 14:47

Завершают обзор новости от Pika Labs и Kuaishou. Pika анонсировала функцию Pika Editions — продвинутый инструмент видео-инпейнтинга (видеовставок) . Пользователи могут добавлять любые объекты в существующие видео: например, вставить бегущего тираннозавра в ролик с пляжа или гигантского паука на лицо спящего друга . Уэс Рот считает, что именно такие функции станут «киллер-фичей» для массового пользователя .

Китайский сервис Kling представил Kling Elements — модель, позволяющую объединять несколько изображений для генерации одного видео . Это дает возможность пользователям помещать себя в любые фантастические декорации, например, на борт «Тысячелетнего сокола» .

В конце видео Рот иронизирует над знаменитой фразой Хана Соло о том, что он прошел «Путь контрабандиста» (Kessel Run) менее чем за 12 парсеков. Автор напоминает, что парсек — это единица расстояния, а не времени, поэтому утверждение звучит так же нелепо, как «моя машина настолько быстрая, что доезжает до магазина менее чем за 5 миль» .

💬 Цитаты

«2025 год — это год роботов.»

«Когда мы ограничиваем количество чипов и вычислений, необходимость становится матерью изобретательности.»

«SSI намерена масштабироваться в тишине, изолируя прогресс от коммерческого давления.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Self-play
Метод обучения ИИ, при котором агенты соревнуются или взаимодействуют друг с другом в симуляции без использования человеческих примеров.
In-painting
Технология редактирования изображений или видео, позволяющая изменять или добавлять объекты внутри существующего контента с сохранением фона.
Parsec (Парсек)
Единица измерения расстояния в астрономии, равная примерно 3,26 светового года.
SOTA (State-of-the-Art)
Наивысший достигнутый на данный момент уровень развития технологии или точности модели.
📊 Цифры
🗓 Хронология
  1. Сентябрь 2024 Предыдущий раунд финансирования SSI с оценкой в $5 млрд.
  2. Май 2024 Смерть собаки Кабосу, ставшей лицом мема Doge.
  3. Февраль 2025 Оценка SSI достигла $20 млрд (согласно контексту видео).
⚖️ Другая сторона
Искусственный интеллект ByteDance Apple Giga flow Safe Superintelligence Luma AI OmniHuman-1