Создание качественного видеоконтента с помощью искусственного интеллекта перестало быть уделом узких специалистов, превратившись в доступный «стек» инструментов для контент-мейкеров. Джастин, партнер венчурной фирмы Andreessen Horowitz (a16z) и автор проекта Venture Twins, представила свой актуальный набор ИИ-сервисов, который позволяет создавать видео от текстового промпта до профессионального улучшения итогового ролика.
🎥 Текстовая генерация видео: Google V3 0:39
Для задач, требующих создания видео из текста с нативной аудиодорожкой (например, эффектами или диалогами), Джастин выделяет модель V3, доступную в рамках платформы Flow в Google Labs (labs.google/fx/tools/flow).
- Подписка: Для работы требуется подписка Google Ultra AI.
- Выбор режима: Важно выбирать именно функцию «Text to video», так как другие режимы (например, «Frames to video») не поддерживают генерацию звука.
- Параметры: Рекомендуется генерировать по два варианта на промпт, чтобы экономить кредиты, и внимательно следить за тем, чтобы интерфейс не переключал модель обратно на версию V2.
Советы по промптингу: Вместо перегруженных описаний Джастин предпочитает итеративный подход. Для создания связных сюжетов (например, пролета дрона через несколько комнат) важно описывать сцены последовательно, иначе модель может создать «рваный» монтаж с нелогичными переходами. При создании диалогов эксперт советует избегать коротких скриптов: если аудио короче длительности видео, модель начинает генерировать «мусорные» звуки или странные паузы.
🎨 Анимация изображений: Kling 2.1 4:09
Если задача состоит в «оживлении» готового фото, лучшим инструментом Джастин называет модель Kling 2.1 (app.clingai.com).
- Настройка: Для получения максимального качества необходимо выбрать модель «Master».
- Управление: На текущий момент поддерживается только начальный кадр. Можно задавать параметры движения камеры (например, слежение за субъектом).
- Особенности: По словам Джастин, Kling отличается устойчивостью — его «трудно испортить» неудачным промптом.
🗣 Создание говорящих аватаров: Hedra 6:52
Для имитации речи персонажей автор рекомендует платформу Hedra (hedra.com). Процесс требует трех компонентов: изображения персонажа, аудиоскрипта и текстового промпта для управления мимикой.
- Гибкость: Можно загрузить готовую аудиозапись, записать голос прямо в браузере или использовать функцию клонирования голоса, что позволяет аватару произносить любой текст.
- Сложные сцены: Если на изображении несколько персонажей, можно вручную выделить область лица, которая должна быть анимирована.
- Нюансы: Джастин отмечает, что результаты выглядят естественнее, если начинать с изображения персонажа с нейтральным выражением лица.
⚡️ Визуальные эффекты: Higsfield 9:41
Для добавления профессиональных VFX-эффектов (например, огня или специфических стилизаций) используется платформа Higsfield. Она позволяет как загружать собственные исходники, так и использовать встроенные модели для обработки видео.
🛠 Единый хаб: Krea 11:30
Krea выступает в роли многофункциональной платформы, где можно тестировать разные модели (например, Pika 2.2 или открытые модели типа Hunyuan) на одном и том же исходном кадре.
Ключевой функционал:
- Сравнение: Возможность запустить один промпт сразу в нескольких моделях и выбрать лучший результат.
- Улучшение (Enhancer): Внутри Krea есть встроенные инструменты для апскейлинга и улучшения видео (например, модели Topaz).
- Параметры: Можно увеличивать частоту кадров (до 60 FPS) и корректировать такие показатели, как уровень зернистости.