Lightrix выпустила LTX-2: первая по-настоящему открытая видеомодель с кодом обучения

Wes Roth 36,6 тыс. 21 мин 4 мин 31.01.2026
Главное

Компания Lightrix представила LTX-2 — новую флагманскую открытую модель для генерации видео, которая претендует на звание самого значимого релиза в индустрии за последний год. В отличие от многих конкурентов, проект предлагает не просто закрытое демо, а полный доступ к весам, тренировочному коду и инструментам для адаптации под профессиональные рабочие процессы.

🎥 Новая эра открытого видео: что такое LTX-2 0:00

LTX-2 — это не очередная «обертка» над существующими сервисами, а полноценная базовая модель видеогенерации от компании Lightrix . Главная особенность релиза заключается в его полной открытости: разработчики опубликовали не только веса (weights), но и полный тренировочный код, а также фреймворки для дообучения .

По мнению автора канала Веса Рота (Wes Roth), это самый важный релиз в сфере AI-видео за текущий и прошлый годы . Модель оптимизирована для работы на потребительском оборудовании, в частности на видеокартах NVIDIA серии RTX, что делает высококачественную генерацию видео доступной в домашних условиях .

Основные характеристики модели:

💻 Технические требования и оптимизация 1:50

Для работы с полной версией модели требуется серьезное оборудование. Вес Рот тестировал LTX-2 на своей рабочей станции со следующими характеристиками:

Однако, по словам Рота, пользователям не обязательно иметь столь мощную систему . Lightrix выпустила дистиллированные (distilled) и квантованные варианты моделей, которые значительно снижают требования к памяти без критической потери качества . Это делает локальную генерацию быстрой и практичной даже на средних пользовательских ПК .

🛠 Работа в ComfyUI: узлы и этапы генерации 3:46

LTX-2 интегрируется напрямую в ComfyUI — популярный инструмент с нодовым (узловым) интерфейсом для локального запуска нейросетей . Процесс генерации в LTX-2 разделен на два ключевых этапа:

  1. Базовая генерация: модель создает видео в низком разрешении .
  2. Пространственный апскейлер: полученные данные передаются во вторую стадию, где происходит уточнение деталей и масштабирование до финального высокого разрешения .

Вес Рот отмечает, что использование дистиллированной модели (Distilled) значительно ускоряет процесс итерации . В его тестах генерация 5-секундного клика (121 кадр при 24 fps) заняла:

Рот рекомендует использовать дистиллированную версию для быстрых экспериментов и подбора промптов, а финальный рендер выполнять на полной модели для достижения максимального качества .

🎮 Управление движением через LoRA и промпты 13:56

Для тонкого контроля над результатом Lightrix предоставила набор специальных LoRA (Low-Rank Adaptations) — легких модулей, которые обучают базовую модель конкретным стилям или движениям камеры .

В релиз включены «IC-LoRA» для управления камерой:

Критически важный нюанс, на который указывает Вес Рот: LoRA необходимо применять к обоим этапам генерации (и к базе, и к апскейлеру) . Если применить эффект только к первой стадии, апскейлер может «галлюцинировать» детали, которые не соответствуют задуманному движению .

При написании промптов для таких моделей Рот советует использовать естественный язык и описывать не только само движение (например, «Dolly left shot»), но и то, что должно открыться за кадром при смещении камеры (параллакс, скрытые объекты) .

🖼 Оживление классики: Image-to-Video 18:08

Функция «изображение в видео» (I2V) позволяет использовать картинку как структурный якорь . Рот продемонстрировал работу этой функции на примере знаменитой картины Эдварда Мунка «Крик» .

Процесс выглядит следующим образом:

  1. Загружается исходное изображение .
  2. Пишется текстовый промпт, описывающий действие (например, «человек издает скорбный крик, идя на камеру») .
  3. Модель анимирует изображение, сохраняя его композицию .

Интересной деталью видео стало признание автора, что он только сейчас узнал, что автором «Крика» является норвежский художник Эдвард Мунк, а не Ван Гог или Сальвадор Дали, как полагали некоторые его знакомые .

💎 Почему открытость кода важнее всего 19:44

В завершение Вес Рот подчеркивает, что LTX-2 кардинально отличается от многих «открытых» моделей, которые на деле являются тупиковыми ветками развития . Благодаря публикации тренировочного кода и рецептов обучения, разработчики и студии могут:

По мнению Рота, Lightrix сделала огромный вклад в сообщество, выпустив действительно открытый инструмент, а не просто ограниченное демо . Он призывает зрителей скачивать веса с репозитория GitHub и делиться результатами в социальных сетях .

💬 Цитаты

«Это может быть самый важный релиз в AI-видео, который мы видели за весь этот год и прошлый тоже.»

«LTX-2 отличается тем, что Lightrix выпустила тренировочный код, бенчмарки и полные веса. Это не просто инструмент, который вы используете, это ваше для адаптации.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Open Weights
Открытые веса нейросети, позволяющие запускать её на собственном оборудовании без обращения к API разработчика.
Distilled Weights
Упрощенная («сжатая») версия модели, которая работает быстрее и требует меньше видеопамяти.
LoRA (Low-Rank Adaptation)
Метод дообучения нейросетей с помощью небольших дополнительных слоев для изменения стиля или функций без изменения основной модели.
ComfyUI
Графический интерфейс для Stable Diffusion и видеомоделей, использующий систему узлов (nodes) для построения сложных цепочек генерации.
IC-LoRA
Специальные адаптеры для управления движением камеры (In-Context LoRA).
📊 Цифры
🗓 Хронология
  1. 2024 Релиз видеомодели LTX-2 от компании Lightrix.
⚖️ Другая сторона
Искусственный интеллект LTX-2 Lightrix ComfyUI NVIDIA RTX Wes Roth