В мире генеративного видео произошел очередной тектонический сдвиг: компания Runway открыла публичный доступ к своей новой модели Gen-3 Alpha. Ведущий технологического канала Уэс Рот провёл масштабное тестирование нейросети, чтобы выяснить, действительно ли индустрия вплотную приблизилась к качеству долгожданной, но всё ещё недоступной Sora от OpenAI.
🚀 Новая эра видеогенерации: запуск Gen-3 0:00
Уэс Рот сообщает, что после короткого периода закрытого тестирования модель Gen-3 Alpha теперь доступна всем пользователям . В отличие от многих других сервисов, где рекламные ролики (cherry-picked) сильно отличаются от реальности, Runway, по мнению автора, выдаёт стабильно качественный результат даже на случайных запросах .
В ходе эксперимента Уэс Рот использовал систему оценок от 1 до 5 звёзд:
- 1-2 звезды: бессмыслица, полное отсутствие логики в кадре.
- 3 звезды: достойный результат, но с заметными ИИ-артефактами.
- 4-5 звёзд: высокое качество, реализм или исключительная визуальная эстетика .
📊 Битва промптов: От «шедевров» до «провала» 1:07
Первые тесты показали впечатляющую работу с освещением и текстурами. Дрон, летящий над водопадом, получил 5 баллов за реалистичные испарения воды и зелень . Кадр с «драгоценным крабом» на пляже был оценен в 4 балла за детализацию самоцветов и блики на солнце .
Ключевые успехи модели:
- Динамическое освещение: В сцене с девушкой, читающей горящую книгу в ночном Токио (5 баллов), нейросеть точно передала отблески пламени на одежде и лице .
- Анатомия и фокус: Крупный план моргающего женского глаза в «золотой час» (magic hour) Уэс Рот назвал идеальным, отметив безупречное качество видео .
- Сложные POV-кадры: Вид от лица (POV) водителя снегохода и гоночные игры в стиле NFS получили высший балл за атмосферность и корректную передачу скорости , .
Основные слабости (The Suck): 11:06
Как только запросы становились специфическими или абсурдными, модель начинала давать сбои. Попытка создать шутер, где вместо оружия используются птицы, провалилась (1 балл) — изображение стало дерганым и морфирующим .
Также Уэс Рот выделил следующие проблемы:
- Взаимодействие с объектами: Танцовщица бурлеска, пьющая пиво, в буквальном смысле «поглотила» бутылку губами .
- Логика техники: При генерации танка башня становилась прозрачной или проходила сквозь объекты (клиппинг) при движении на камеру .
- Проблема пола: Запрос на «женщин-гладиаторов» выдал мускулистые фигуры с бородами, где единственным отличием стала женская одежда .
🛠️ Секреты эффективного промптинга 23:12
Компания Runway опубликовала официальное руководство по составлению запросов, рекомендуя структуру через двоеточия и точки . Например: Camera Movement: [Type]. Establishing Scene: [Description]. Additional Details: [Environment].
Однако, основываясь на своём опыте, Уэс Рот утверждает, что естественный язык (простое описание того, что вы хотите видеть) зачастую работает лучше, чем жестко структурированные команды . По его мнению, избыточная сложность промпта иногда мешает модели проявить её «естественные способности» .
Полезные ключевые слова (Keywords) для управления камерой:
- fpv / POV: вид от первого лица (fpv работает более стабильно) .
- SnorriCam: эффект камеры, закрепленной на теле актера (лицо неподвижно, фон движется) .
- Dynamic motion: критически важное слово для «летающих» кадров с дрона, добавляющее жизни в сцену .
- Macro cinematography: для сверхкрупных планов насекомых или деталей .
Эффекты движения и стили:
- Movement:
Explodes(взрывается),Shatters(разбивается вдребезги — работает отлично),Undulates(волнистое движение) . - Styles:
VHS,Glitchcore,Cinematic,Iridescent.
🎬 Будущее кино и конкуренция с Sora 31:12
Уэс Рот отмечает, что хотя Gen-3 иногда допускает физические ошибки, она уже позволяет создавать короткие фильмы и музыкальные клипы. В качестве примера он упоминает платформу «Runway Watch», где собраны лучшие работы художников, созданные с помощью этих инструментов .
Автор задается вопросом: не была ли Sora от OpenAI лишь набором тщательно отобранных (cherry-picked) кадров, в то время как Runway Gen-3 уже сейчас предоставляет сопоставимое качество в реальном доступе? По прогнозу Уэса Рота, мы стоим на пороге появления полноценной индустрии ИИ-режиссёров и сторителлеров .