OpenAI Sora: как разоблачить видео, созданное нейросетью?

The Wall Street Journal 1,1 млн 7 мин 2 мин
Главное

Искусство цифрового обмана: Как распознать видео, созданное OpenAI Sora 🔍 0:00

С появлением новых генеративных инструментов, таких как нейросеть Sora от компании OpenAI, грань между реальностью и компьютерной графикой становится все более призрачной. Новая технология позволяет создавать высококачественные видеоролики по текстовому запросу без участия профессиональных студий анимации. Несмотря на впечатляющие возможности, Sora все еще сталкивается с фундаментальными проблемами понимания физики реального мира, что оставляет зрителям шансы на разоблачение ИИ-контента.

Анатомия ошибок ИИ: Физика и логика движений 🧠 0:00

Стивен Мессер, сооснователь компании Collective[i], специализирующейся на продажах с использованием ИИ, отмечает, что наши органы чувств часто первыми сигнализируют о подделке, когда мы видим «странные» вещи. Даже при визуальной безупречности на первый взгляд, алгоритмы часто ошибаются в базовых физических взаимодействиях:

Архитектурные парадоксы и визуальные нестыковки 🏗️ 2:35

Помимо биологии, Sora часто демонстрирует проблемы с пространственным мышлением. В сложных сценах нейросеть может «сваливать» в одну кучу архитектурные элементы, которые невозможно использовать по назначению.

Примеры пространственных ошибок:

Вызовы для индустрии и общества ⚖️ 4:33

Технологический прорыв OpenAI вызывает не только восхищение, но и серьезную обеспокоенность. Сейчас компания столкнулась с рядом судебных исков, связанных с вопросом использования защищенного авторским правом контента для обучения нейросетей.

По мнению Стивена Мессера, текущая ситуация напоминает ранний этап развития Google, когда компания монетизировала результаты, полученные за счет использования чужого труда. Кроме того, эксперты указывают на следующие риски:

  1. Дезинформация: Существует реальная угроза использования Sora для создания мощной политической пропаганды.
  2. Приватность: Поскольку модель обучалась на видео из интернета, теоретически в данных могли оказаться фрагменты личных семейных съемок пользователей.

OpenAI, в свою очередь, заявляет о принятии мер безопасности, включая запрет на использование платформы для политических кампаний и разработку инструментов для детектирования видео, созданных Sora.

Перспективы и ограничения: «Галлюцинации» и демократизация творчества 🎥 5:52

Несмотря на опасения, эксперты сходятся во мнении: Sora пока не угрожает профессиональному кинематографу. Главное техническое ограничение заключается в том, что нейросеть склонна к «галлюцинациям» — по мере увеличения длительности видео модель теряет согласованность, и картинка начинает «разваливаться». На данный момент максимальная длительность качественного клипа составляет около минуты.

Тем не менее, для начинающих авторов Sora может стать мощным инструментом «демократизации» видеопроизводства. Способность генерировать видео даже из одного статического изображения открывает новые горизонты для визуализации идей, которые раньше были недоступны из-за отсутствия бюджетов или навыков профессиональной анимации.

💬 Цитаты

«Это вещи, которые ИИ все еще не понимает о физическом мире.»

Стивен Мессер 1:18

«Это становится невероятно демократизирующим фактором для мира.»

Стивен Мессер 6:19
👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Текст-в-видео (text-to-video)
Технология создания видеороликов на основе текстового описания, введенного пользователем.
Галлюцинации ИИ
Склонность нейросетей генерировать нелогичные, ошибочные или физически невозможные объекты и сцены.
Демократизация видеопроизводства
Снижение порога входа для создания качественного визуального контента за счет доступных инструментов.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект OpenAI Sora генеративный ИИ