Уэс Рот, эксперт в области искусственного интеллекта и автор популярного YouTube-канала, представил обновленное руководство по работе с Midjourney на 2025 год. По словам Рота, Midjourney остается его самым востребованным инструментом, с помощью которого он создал десятки тысяч изображений, начиная с января 2023 года . В новом обзоре он подробно разбирает путь от первого запроса до создания высококачественного видео на основе ИИ-генераций.
🎨 Первые шаги: интерфейс и базовая генерация 0:00
Процесс работы с Midjourney в 2025 году стал значительно проще благодаря обновленному веб-интерфейсу на сайте midjourney.com. Ведущий отмечает, что хотя многие пользователи по привычке используют Discord, веб-версия теперь предоставляет все необходимые инструменты в интуитивно понятном виде .
Для начала работы достаточно зайти в раздел «Create» и ввести текстовый запрос (промпт) в соответствующее поле . Рот демонстрирует процесс на примере сложного запроса: сцена боя из «Джона Уика», выполненная в стиле оригами, где герой орудует самурайским мечом и пистолетом одновременно .
Ключевые этапы генерации:
- Процесс проявки: Модель строит изображение постепенно, переходя от размытых пятен к четким деталям прямо на глазах пользователя .
- Сетка вариантов: По умолчанию система выдает четыре варианта изображения .
- Навигация: Переключаться между результатами можно кликом мыши или стрелками на клавиатуре .
🔄 Итерация и улучшение: от черновика к шедевру 2:43
Получение первых четырех картинок — это лишь начало. Уэс Рот подчеркивает, что Midjourney предоставляет мощные инструменты для доработки результата.
Вариации (Vary): После выбора понравившегося эскиза пользователь может нажать кнопки «V subtle» (тонкие изменения) или «V strong» (сильные изменения) .
- V subtle: Сохраняет композицию и основные объекты, внося лишь косметические правки .
- V strong: Может существенно изменить одежду, позы и предметы в руках персонажа, сохраняя лишь общую концепцию .
Апскейл (Upscale): Если изображение устраивает по содержанию, его необходимо увеличить. Рот выделяет два типа апскейла:
- Subtle Upscale: Увеличивает разрешение, сохраняя текстуру и детали максимально близко к оригиналу .
- Creative Upscale: Позволяет нейросети добавить новые детали, изменить выражение лица или фактуру материалов .
Автор утверждает, что масштабирование не только увеличивает картинку, но и часто исправляет мелкие артефакты и «странности» исходной генерации .
🎬 Видеогенерация и тарифные планы 5:31
Одной из самых впечатляющих функций 2025 года стала возможность анимировать созданные изображения. Midjourney добавила кнопку «Animate», которая превращает статичную картинку в пятисекундный ролик .
Пользователю доступны два базовых режима анимации:
- Low motion: Для спокойных сцен с минимальным движением .
- High motion: Для динамичных сцен, например, сражений .
Уэс Рот обращает внимание на структуру тарифных планов, что критически важно для активных пользователей .
- Fast mode: Прямая генерация за счет предоплаченных часов .
- Relax mode: Безлимитная генерация (доступна на планах Pro и Mega), которая может занимать больше времени (вплоть до 10 минут ожидания), но позволяет создавать бесконечное количество видео .
- Коммерческое использование: По словам автора, для компаний с доходом более $1 млн в год подписка уровня Pro или Mega является обязательной .
🧠 Искусство промптинга: как добиться совершенства 9:09
Правильно составленный запрос — это 90% успеха. Уэс Рот рекомендует новичкам проводить время в разделе «Explore», изучая работы сообщества . При клике на любое понравившееся изображение можно увидеть полный текст промпта, который его создал .
Формула идеального промпта от Уэса Рота включает в себя:
- Объект (Subject): Кто или что в центре внимания (например, «22-летний европеец»).
- Медиум (Medium): Самый важный параметр. Это может быть «макрофотография», «масляная живопись», «пиксель-арт» или «акварель» .
- Освещение (Lighting): Контрастный свет, мягкий студийный свет и т.д.
- Настроение (Mood) и Ракурс (Shot type): Например, «крупный план» или «в стиле журнала GQ» .
⚙️ Технические параметры и тонкая настройка 11:50
Помимо текста, Midjourney использует специальные параметры, которые пишутся в конце запроса через двойное тире.
- Aspect Ratio (
--ar): Позволяет задать формат кадра. Самые популярные:16:9для киноэкрана,9:16для смартфонов (Reels/TikTok) и1:1для квадрата . - Stylize (
--s): Регулирует степень «художественности». Значения от 0 до 1000 позволяют выбрать между строгим следованием промпту и творческой свободой нейросети . - Chaos (
--c): Параметр от 0 до 100, который определяет, насколько разными будут четыре начальных варианта. Высокий хаос может привести к совершенно непредсказуемым и «странным» результатам . - Raw Mode (
--style raw): Позволяет обойти стандартный «эстетический фильтр» Midjourney, делая изображения более реалистичными или менее похожими на типичный арт нейросети .
В заключение Рот упоминает функции персонализации: со временем система учится на ваших лайках и начинает подстраивать генерации под ваш личный вкус . Также появились «мудборды» (Mood boards) для создания целых серий изображений в едином стиле .