Уэс Рот о Kling 2.0: «ИИ-видео стало слишком реалистичным»

Wes Roth 97,4 тыс. 17 мин 3 мин 15.04.2025
Главное

Выход новой версии нейросети Kling 2.0 вызвал бурную реакцию в сообществе создателей контента из-за резкого скачка качества генерации видео. Ведущий канала Уэс Рот анализирует свежие примеры работ, которые варьируются от гиперреалистичных сцен до сюрреалистичных «кошмаров наяву», демонстрируя возможности модели в передаче физики жидкостей и сложных движений.

🚀 Новый стандарт реализма: Kling 2.0 0:59

По мнению Уэса Рота, индустрия ИИ-видео только что сделала огромный шаг вперед, который многие пользователи называют «десятикратным улучшением качества за одну ночь» . Основной акцент в новой версии Kling сделан на беспрецедентной детализации графики и консистентности кадров, чего раньше не удавалось достичь с такой стабильностью .

Ключевые особенности новой модели:

👤 «Кошмары наяву» и лиминальные пространства 2:05

Одним из самых впечатляющих, но пугающих примеров использования нейросети стал проект под названием «Led by Legends» («Ведомые легендами»). Уэс Рот описывает эти кадры как «топливо для ночных кошмаров», отмечая их жуткую, потустороннюю атмосферу .

Специфика этих генераций включает:

🌊 Прорыв в физике жидкостей и отражениях 6:55

Анимация жидкостей традиционно считается одной из самых сложных задач в 3D-графике, требующей целых научных отделов для разработки. Однако Kling 2.0 демонстрирует поразительные результаты в этой области без использования классического рендеринга .

Автор видео выделяет несколько ключевых технических достижений:

🏎️ Сложные ракурсы и потенциал для VR 5:28

Уэс Рот отмечает, что Kling 2.0 справляется с ракурсами, которые раньше были «камнем преткновения» для ИИ. В частности, речь идет о съемке самолета, пролетающего прямо над камерой . В этом кадре свет солнца реалистично пробивается сквозь отверстия в фюзеляже, создавая сложную игру света и тени .

Перспективы применения технологии, по мнению Рота:

  1. Интеграция в видеоигры: Существующие диффузионные модели уже позволяют генерировать окружение в реальном времени.
  2. Виртуальная реальность (VR): Высокое качество картинки первого лица (например, в сценах сражений рыцарей) может обеспечить полное погружение .
  3. Интерактивный контент: Управление виртуальным байком или машиной с мгновенной генерацией отклика ИИ .

🎬 Стилизация: от Mad Max до рэп-клипов 10:48

Нейросеть демонстрирует гибкость в работе с различными визуальными стилями. Уэс Рот обращает внимание на то, как точно Kling 2.0 улавливает атмосферу известных кинофраншиз, таких как Mad Max . Цветовая гамма, одежда персонажей и общее ощущение постапокалипсиса переданы с высокой точностью.

Примеры консистентности в деталях:

По мнению Уэса Рота, на текущий момент Kling 2.0 является «моделью, которую нужно превзойти» всем остальным игрокам на рынке ИИ-видео .

💬 Цитаты

«Качество ИИ-видео только что выросло в 10 раз за одну ночь. Я лишился дара речи.»

Уэс Рот (цитируя PJ Ace) 1:12

«Это определенно ощущается как сон. Есть определенное качество сновидения в этих кадрах.»

Уэс Рот 2:30

«В 3D-анимации моделирование жидкостей и воды — это печально известная сложная задача. Здесь же всё выглядит потрясающе.»

Уэс Рот 6:57
👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Лиминальное пространство
Тип пространства, вызывающий чувство тревоги или ностальгии, часто пустые коридоры или залы, кажущиеся нереальными.
Диффузионная модель
Тип архитектуры нейросетей, используемый для генерации изображений и видео из шума на основе текстовых промптов.
Артефакты ИИ
Визуальные ошибки генерации, такие как лишние пальцы, исчезающие объекты или искаженные движения.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Kling 2.0 Wes Roth ИИ-видео нейросети генерация видео