🎬 Обзор Sora от Маркеса Браунли: будущее ИИ-видео уже здесь 0:40
В своем новом обзоре популярный технологический блогер Маркес Браунли делится впечатлениями от работы с Sora — новейшим инструментом генерации видео от компании OpenAI. Проведя неделю в режиме полноценного доступа к сервису, ведущий проанализировал возможности нейросети, её сильные и слабые стороны, а также потенциальные риски для общества в эпоху «постправды».
🛠 Интерфейс и возможности инструмента 2:01
Sora представляет собой мощный инструмент, доступ к которому скоро получат миллионы пользователей. Основные элементы управления включают:
- Библиотека и избранное: Возможность сохранять удачные генерации и просматривать промпты других пользователей для вдохновения.
- Функция Remix: Позволяет брать существующий результат и вносить в него изменения, задавая степень креативности нейросети (от «мягкого» до «сильного» ремикса).
- Контроль параметров: Пользователи могут выбирать разрешение (360p генерируется быстрее) и управлять длительностью.
- Storyboard: Встроенный редактор для последовательного объединения нескольких промптов в один длинный ролик.
По словам автора видео, генерация 5-секундного видео в 360p занимает менее 20 секунд, тогда как создание детального 10-секундного ролика в 1080p может потребовать нескольких минут работы серверов OpenAI.
📉 Технические ограничения и проблемы физики 6:26
Маркес Браунли выделяет несколько ключевых проблем, которые делают контент Sora узнаваемым:
- Отсутствие «постоянства объектов» (object permanence): Объекты могут бесследно исчезать, появляться из ниоткуда или проходить друг сквозь друга без логики.
- Проблемы с анатомией: При генерации людей или существ, которые должны идти, нейросеть часто путает передние и задние ноги, что создает неестественный эффект.
- Непонимание физических законов: Движения объектов часто выглядят «странно» или неоправданно замедленно, особенно в фотореалистичных сценах. Ведущий отмечает, что Sora неплохо справляется с динамикой воды и огня, но пасует перед сложными бытовыми сценами.
🎯 Где Sora работает лучше всего? 11:27
Несмотря на недостатки, Маркес Браунли нашел сценарии, в которых инструмент показывает достойные результаты:
- Абстракции: Генерация текстур, цветов и градиентов, которые подходят для фонов или экранных заставок.
- Текст: Нейросеть научилась точнее воспроизводить текст на отдельных слайдах, например, для интро или титров документальных фильмов.
- Стилизованная анимация: В мультяшных или стоп-моушн стилях огрехи физики и движений воспринимаются как художественный выбор, а не ошибка.
⚖️ Этика и будущие риски 13:54
Главная дискуссия вокруг Sora касается авторского права и безопасности. Инструмент весьма привередлив: он отказывается генерировать видео с публичными личностями, защищенными персонажами или изображениями детей. Тем не менее, ведущий обеспокоен непрозрачностью данных, на которых обучалась модель, и потенциальным воздействием на медиапространство.
По мнению Маркеса Браунли, появление таких инструментов знаменует начало эры, когда доверять увиденному в интернете становится всё сложнее. Учитывая, что текущие результаты — это лишь «худший уровень» технологий, которые будут только совершенствоваться, обществу предстоит серьезный вызов в плане проверки подлинности контента.