Видеоредактирование в эпоху ИИ: интервью с CEO Descript Эндрю Мейсоном 1:17
В недавнем выпуске подкаста The Cognitive Revolution ведущий Нейтан Ленц побеседовал с Эндрю Мейсоном, генеральным директором компании Descript. Descript — это платформа для редактирования видео и аудио, которая стремится сделать процесс монтажа таким же простым и интуитивным, как редактирование обычного текстового документа. В ходе беседы Мейсон рассказал о видении будущего контента, влиянии генеративного ИИ на рабочие процессы и стратегии развития своего продукта.
🎨 Революция в инструментах монтажа 5:28
По мнению Мейсона, создание видео и аудио контента должно стать таким же фундаментальным навыком, как создание текста. Изначально Descript создавался на базе технологий ИИ-транскрибации, чтобы избавить пользователей от медленных и сложных временных шкал (таймлайнов), типичных для профессионального монтажного ПО.
Команда Descript представила набор функций под названием Underlord, объединяющий возможности генеративного ИИ для автоматизации рутинных задач. Среди наиболее популярных и значимых инструментов Мейсон выделяет:
- Удаление пауз и слов-паразитов: инструменты, которые существенно упрощают процесс "чистки" сырого материала.
- Studio Sound: ИИ-эффект, который позволяет превратить запись с обычного компьютерного микрофона в звук студийного качества, устраняя фоновые шумы и эхо.
- Eye Contact (Зрительный контакт): функция, корректирующая направление взгляда спикера на видео, чтобы казалось, будто он смотрит в камеру, даже если на самом деле он читает текст с экрана.
- Remove Retakes (Удаление дублей): система, которая автоматически распознает повторные попытки произнести одну и ту же фразу и оставляет только лучший дубль.
Мейсон подчеркивает, что такие функции позволяют авторам сосредоточиться на идеях, не отвлекаясь на технические сложности процесса.
🤝 Стратегия интеграций и партнерство с OpenAI 14:40
В отличие от многих компаний, стремящихся строить абсолютно всё внутри собственной экосистемы, Descript придерживается открытого подхода. Мейсон утверждает, что у компании «нет никакой религии» относительно обязательного создания собственных моделей. Если на рынке появляется более качественное решение — например, для очистки аудио или синтеза речи — Descript стремится интегрировать его, чтобы предложить пользователям лучший опыт.
Что касается партнерства с OpenAI, Мейсон отмечает, что это началось как стандартное привлечение инвестиций, которое со временем переросло в возможность для команды Descript консультироваться с передовыми исследователями в области ИИ. Хотя конкретные планы по созданию кастомных моделей на базе технологий OpenAI остались без прямого подтверждения, Мейсон признает потенциал дообучения моделей на специализированных данных, как это делают в юридических стартапах вроде Harvey.
🔮 Будущее генеративного видео и аватаров 27:28
Говоря о будущем, Мейсон видит большой потенциал в генеративном видео, которое может решить проблему «визуального украшательства». По его словам, многие современные ролики (включая подкасты) визуально статичны, и генеративные инструменты могли бы динамически добавлять графику, анимацию или визуальные пояснения, превращая текст в полноценный видеоряд.
В отношении ИИ-аватаров (вроде HeyGen) Мейсон высказывается осторожно:
- Технология всё еще находится в стадии «неприятной долины» (uncanny valley), хотя качество стремительно растет.
- По мнению Мейсона, главная проблема нынешних ИИ-подкастов не в качестве голоса или картинки, а в низком качестве самих идей, которые транслируются.
- ИИ-аватары могут стать по-настоящему полезными в таких кейсах, как автоматический перевод контента на другие языки, что откроет авторам доступ к глобальной аудитории.
🛠 Управление ИИ-разработкой 43:52
Разработка продуктов с использованием ИИ сильно отличается от традиционного софтверного инжиниринга. Мейсон отмечает высокую степень неопределенности: требования и возможности моделей меняются по мере развития исследований.
Главные уроки, которые извлек Мейсон при работе с инженерами ИИ:
- Принятие риска: В исследовательских проектах некоторые ставки не сыграют, и нужно быть готовым начать с нуля.
- Неопределенность ограничений: Инженерные ограничения (например, время обучения модели) могут меняться прямо в процессе разработки, что заставляет пересматривать концепцию продукта.
- Стратегия «рисковать в начале»: Необходимо проводить самые сложные технические эксперименты на раннем этапе, чтобы подтвердить жизнеспособность идеи.