# Lightrix выпустила LTX-2: первая по-настоящему открытая видеомодель с кодом обучения

Источник: https://www.youtube.com/watch?v=hkfSfr-hMWs
Канал: Wes Roth
Опубликовано: 31.01.2026

---

Компания Lightrix представила LTX-2 — новую флагманскую открытую модель для генерации видео, которая претендует на звание самого значимого релиза в индустрии за последний год. В отличие от многих конкурентов, проект предлагает не просто закрытое демо, а полный доступ к весам, тренировочному коду и инструментам для адаптации под профессиональные рабочие процессы.

## 🎥 Новая эра открытого видео: что такое LTX-2
[[JUMP:0:00]]

LTX-2 — это не очередная «обертка» над существующими сервисами, а полноценная базовая модель видеогенерации от компании Lightrix [0:00]. Главная особенность релиза заключается в его полной открытости: разработчики опубликовали не только веса (weights), но и полный тренировочный код, а также фреймворки для дообучения [0:13]. 

По мнению автора канала Веса Рота (Wes Roth), это самый важный релиз в сфере AI-видео за текущий и прошлый годы [0:00]. Модель оптимизирована для работы на потребительском оборудовании, в частности на видеокартах NVIDIA серии RTX, что делает высококачественную генерацию видео доступной в домашних условиях [0:40]. 

Основные характеристики модели:

*   Поддержка разрешения до 4K [1:22].
*   Нативная поддержка аудио (генерация видео, синхронизированного со звуком) [0:40].
*   Мультимодальные пайплайны: текст в видео (Text-to-Video), изображение в видео (Image-to-Video), видео в видео и генерация с условием по аудио [2:16].
*   Полная бесплатность и открытый исходный код [1:22].

## 💻 Технические требования и оптимизация
[[JUMP:1:50]]

Для работы с полной версией модели требуется серьезное оборудование. Вес Рот тестировал LTX-2 на своей рабочей станции со следующими характеристиками:

*   **GPU:** NVIDIA GeForce RTX 4090 (24 ГБ видеопамяти) [2:53].
*   **CPU:** Intel Core i9 [2:53].
*   **RAM:** 64 ГБ оперативной памяти [3:06].

Однако, по словам Рота, пользователям не обязательно иметь столь мощную систему [3:32]. Lightrix выпустила дистиллированные (distilled) и квантованные варианты моделей, которые значительно снижают требования к памяти без критической потери качества [3:32]. Это делает локальную генерацию быстрой и практичной даже на средних пользовательских ПК [4:22].

## 🛠 Работа в ComfyUI: узлы и этапы генерации
[[JUMP:3:46]]

LTX-2 интегрируется напрямую в ComfyUI — популярный инструмент с нодовым (узловым) интерфейсом для локального запуска нейросетей [3:46]. Процесс генерации в LTX-2 разделен на два ключевых этапа:

1.  **Базовая генерация:** модель создает видео в низком разрешении [12:26].
2.  **Пространственный апскейлер:** полученные данные передаются во вторую стадию, где происходит уточнение деталей и масштабирование до финального высокого разрешения [12:39].

Вес Рот отмечает, что использование дистиллированной модели (Distilled) значительно ускоряет процесс итерации [7:04]. В его тестах генерация 5-секундного клика (121 кадр при 24 fps) заняла:

*   53 секунды на дистиллированной модели [8:00].
*   2 минуты 27 секунд на полной версии модели [8:00].

Рот рекомендует использовать дистиллированную версию для быстрых экспериментов и подбора промптов, а финальный рендер выполнять на полной модели для достижения максимального качества [7:18].

## 🎮 Управление движением через LoRA и промпты
[[JUMP:13:56]]

Для тонкого контроля над результатом Lightrix предоставила набор специальных LoRA (Low-Rank Adaptations) — легких модулей, которые обучают базовую модель конкретным стилям или движениям камеры [14:09]. 

В релиз включены «IC-LoRA» для управления камерой:

*   **Dolly Left / Dolly Right:** движение камеры влево или вправо [14:48].
*   **Dolly Out:** отдаление камеры [14:48].

Критически важный нюанс, на который указывает Вес Рот: LoRA необходимо применять к обоим этапам генерации (и к базе, и к апскейлеру) [16:07]. Если применить эффект только к первой стадии, апскейлер может «галлюцинировать» детали, которые не соответствуют задуманному движению [16:07].

При написании промптов для таких моделей Рот советует использовать естественный язык и описывать не только само движение (например, «Dolly left shot»), но и то, что должно открыться за кадром при смещении камеры (параллакс, скрытые объекты) [17:28].

## 🖼 Оживление классики: Image-to-Video
[[JUMP:18:08]]

Функция «изображение в видео» (I2V) позволяет использовать картинку как структурный якорь [18:48]. Рот продемонстрировал работу этой функции на примере знаменитой картины Эдварда Мунка «Крик» [19:29]. 

Процесс выглядит следующим образом:

1.  Загружается исходное изображение [18:22].
2.  Пишется текстовый промпт, описывающий действие (например, «человек издает скорбный крик, идя на камеру») [19:15].
3.  Модель анимирует изображение, сохраняя его композицию [18:48].

Интересной деталью видео стало признание автора, что он только сейчас узнал, что автором «Крика» является норвежский художник Эдвард Мунк, а не Ван Гог или Сальвадор Дали, как полагали некоторые его знакомые [19:29].

## 💎 Почему открытость кода важнее всего
[[JUMP:19:44]]

В завершение Вес Рот подчеркивает, что LTX-2 кардинально отличается от многих «открытых» моделей, которые на деле являются тупиковыми ветками развития [19:44]. Благодаря публикации тренировочного кода и рецептов обучения, разработчики и студии могут:

*   Адаптировать модель под свои специфические нужды и пайплайны [2:03].
*   Обеспечить приватность интеллектуальной собственности (IP), запуская всё на локальных серверах [20:12].
*   Проверять результаты бенчмарков самостоятельно [20:27].

По мнению Рота, Lightrix сделала огромный вклад в сообщество, выпустив действительно открытый инструмент, а не просто ограниченное демо [20:43]. Он призывает зрителей скачивать веса с репозитория GitHub и делиться результатами в социальных сетях [20:27].