Уэс Рот: «Король ИИ-видео уже здесь — Runway Gen-3 доступен всем»

Wes Roth 35,4 тыс. 32 мин 3 мин 03.07.2024
Главное

В мире генеративного видео произошел очередной тектонический сдвиг: компания Runway открыла публичный доступ к своей новой модели Gen-3 Alpha. Ведущий технологического канала Уэс Рот провёл масштабное тестирование нейросети, чтобы выяснить, действительно ли индустрия вплотную приблизилась к качеству долгожданной, но всё ещё недоступной Sora от OpenAI.

🚀 Новая эра видеогенерации: запуск Gen-3 0:00

Уэс Рот сообщает, что после короткого периода закрытого тестирования модель Gen-3 Alpha теперь доступна всем пользователям . В отличие от многих других сервисов, где рекламные ролики (cherry-picked) сильно отличаются от реальности, Runway, по мнению автора, выдаёт стабильно качественный результат даже на случайных запросах .

В ходе эксперимента Уэс Рот использовал систему оценок от 1 до 5 звёзд:

📊 Битва промптов: От «шедевров» до «провала» 1:07

Первые тесты показали впечатляющую работу с освещением и текстурами. Дрон, летящий над водопадом, получил 5 баллов за реалистичные испарения воды и зелень . Кадр с «драгоценным крабом» на пляже был оценен в 4 балла за детализацию самоцветов и блики на солнце .

Ключевые успехи модели:

Основные слабости (The Suck): 11:06

Как только запросы становились специфическими или абсурдными, модель начинала давать сбои. Попытка создать шутер, где вместо оружия используются птицы, провалилась (1 балл) — изображение стало дерганым и морфирующим .

Также Уэс Рот выделил следующие проблемы:

🛠️ Секреты эффективного промптинга 23:12

Компания Runway опубликовала официальное руководство по составлению запросов, рекомендуя структуру через двоеточия и точки . Например: Camera Movement: [Type]. Establishing Scene: [Description]. Additional Details: [Environment].

Однако, основываясь на своём опыте, Уэс Рот утверждает, что естественный язык (простое описание того, что вы хотите видеть) зачастую работает лучше, чем жестко структурированные команды . По его мнению, избыточная сложность промпта иногда мешает модели проявить её «естественные способности» .

Полезные ключевые слова (Keywords) для управления камерой:

Эффекты движения и стили:

🎬 Будущее кино и конкуренция с Sora 31:12

Уэс Рот отмечает, что хотя Gen-3 иногда допускает физические ошибки, она уже позволяет создавать короткие фильмы и музыкальные клипы. В качестве примера он упоминает платформу «Runway Watch», где собраны лучшие работы художников, созданные с помощью этих инструментов .

Автор задается вопросом: не была ли Sora от OpenAI лишь набором тщательно отобранных (cherry-picked) кадров, в то время как Runway Gen-3 уже сейчас предоставляет сопоставимое качество в реальном доступе? По прогнозу Уэса Рота, мы стоим на пороге появления полноценной индустрии ИИ-режиссёров и сторителлеров .


💬 Цитаты

«Мой лучший совет — просто экспериментируйте и не беспокойтесь о специфическом формате промптов.»

«Похоже, если вы слишком усложняете запрос, вы теряете естественную способность модели создавать крутые видео.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Magic hour (Золотой час)
Короткий период времени перед закатом с мягким золотистым светом, идеальный для съемок.
SnorriCam
Тип съемки, где камера жестко закреплена на актере и направлена на него же.
Lensed flare
Оптический эффект блика в объективе от яркого источника света.
Morfing (Морфинг)
Артефакт ИИ-видео, при котором один объект плавно и неестественно превращается в другой.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Runway ml Gen-3 Alpha Уэс Рот AI video Sora