В индустрии технологий наметился фундаментальный сдвиг: на смену продуктам, в которые искусственный интеллект внедряется как дополнительная функция («AI augmented»), приходят решения, построенные вокруг ИИ как центрального элемента («AI native»). Партнеры венчурного фонда a16z Аниш Ачария и Джастин Мур обсуждают, почему гиганты рынка рискуют проиграть новым стартапам и как меняется рабочий процесс современных специалистов и создателей контента.
🏛️ Проблема «наследства» и преимущество AI Native 0:00
Один из главных вопросов, волнующих индустрию: смогут ли действующие технологические гиганты (инкумбенты) захватить рынок ИИ, обладая огромными данными, штатом инженеров и капиталом . По мнению Аниша Ачарии, в большинстве случаев наиболее интересные и прорывные продукты будут представлять собой совершенно новые интерфейсы, которые стали возможны только благодаря развитию искусственного интеллекта.
Собеседники отмечают, что за последние 18–24 месяца многие компании начали внедрять ИИ в существующие продукты, однако зачастую это выглядит как простая попытка «втиснуть» новую технологию в старые рамки . Аниш Ачария выделяет ключевые отличия:
- Инерция инкумбентов: Крупные компании часто оказываются в ловушке — они не могут радикально изменить свои платформы, не рискуя существующим бизнесом или доходами .
- «Пришитые» функции: Вместо переосмысления пользовательского опыта гиганты добавляют функции ИИ поверх старого интерфейса.
- Историческая аналогия: Аниш Ачария сравнивает это с ранними этапами интернета: перенос каталогов ритейлера Sears на веб-сайт не сделал его лучше Amazon. Amazon изначально строился на новой бизнес-модели и способах поиска товаров, став «нативным» для интернета .
Джастин Мур приводит пример неудачного переноса старых форматов в цифровую среду — «Zoom-вечеринки» (happy hours) . По её мнению, простое нахождение людей в видео-квадратиках — это тупиковый путь адаптации, так как существуют более эффективные способы цифрового взаимодействия.
📄 Смерть «пустого листа» 2:23
Первая важная характеристика нативных ИИ-продуктов — решение проблемы страха перед чистым листом. Инструменты нового поколения радикально сокращают время от идеи до первого черновика, с которым уже можно работать .
В качестве примеров Аниш Ачария приводит следующие компании:
- Durable: Позволяет создавать миллионы веб-сайтов . Пользователь вводит базовую информацию о компании, и сервис мгновенно генерирует готовую отправную точку для дальнейшего редактирования.
- Vizcom: Инструмент для промышленного дизайна и инженерии . Инженеры из обувных и автомобильных компаний загружают бумажные наброски, а система создает первый профессиональный рендер. По словам Аниша Ачарии, это дает специалисту результат, готовый на 80%, что значительно снижает барьер для начала проекта .
🎭 Мультимодальность и мультимедийность 3:44
Второй столп AI Native продуктов — это мультимодальность, то есть одновременное объединение различных типов входных данных и медиаформатов для создания конечного продукта .
Ярким примером здесь выступает компания HeyGen. По словам Аниша Ачарии, её успех обусловлен интеграцией нескольких моделей:
- Визуальная модель, которая анализирует фото и видео пользователя, имитируя мимику и движения глаз .
- Аудиомодель, воссоздающая голос конкретного человека.
- Алгоритм синхронизации губ (lip-sync), обеспечивающий реалистичность видео-аватара .
Такое объединение разрозненных технологий в единый продукт позволяет создавать контент, который был бы невозможен при использовании ИИ только как дополнения.
🎰 Итерация вместо «одноразовой» генерации 4:39
Джастин Мур и Аниш Ачария критикуют подход «одноразовой» генерации (one-shot generation), который часто встречается в продуктах Meta и других крупных игроков. По мнению Аниша Ачарии, генерация картинок «в один клик» — это скорее развлекательная функция или «фишка» (gimmick), а не инструмент для глубокой работы .
Проблемы «одноразового» подхода:
- Эффект игрового автомата: Если результат не идеален (например, готов на 95%), пользователю приходится нажимать кнопку генерации заново в надежде на лучший исход, но вместо этого он может получить результат, который хуже на 30% .
- Отсутствие контроля: Пользователь не может исправить конкретную деталь, не переделывая всё изображение или видео целиком .
В противовес этому нативные ИИ-компании, такие как Pika Labs (генератор видео), внедряют инструменты итерации. Пользователь может выбрать конкретного персонажа или область в сгенерированном клипе и переделать только эту часть, сохраняя остальной контекст .
🛠️ Доработка внутри платформы (Refinement) 6:11
Четвертый аспект — возможность доведения продукта до финального качества внутри одной среды. Аниш Ачария отмечает, что в нативных приложениях функции строятся вокруг модели, а не наоборот .
Примеры глубокой интеграции:
- Krea: Позволяет не только создавать ИИ-арт, но и масштабировать (upscale) его прямо на рабочем холсте, превращая набросок в отполированное произведение .
- Eleven Labs: Начав с генерации голоса, компания создала полноценный продукт для создания аудиокниг . Пользователю не нужно уходить на сторонние ресурсы, чтобы собрать готовый проект из отдельных звуковых фрагментов.
Аниш Ачария утверждает, что лучшие команды сейчас крайне избирательны в выборе и настройке моделей, стремясь создать «магическую» версию продукта с нуля. Он полагает, что Google Calendar, скорее всего, не будет переизобретен самой корпорацией Google, так как их задача — сделать текущий календарь чуть лучше, а не создавать принципиально новый интерфейс, основанный, например, только на голосе .
🔄 Ремиксинг и трансформация контента 8:16
Пятый элемент — это ремиксинг, способность мгновенно превращать один вид контента в другой. Аниш Ачария называет это ядром того, что делает ИИ особенным: возможность взять что угодно и мгновенно сделать из этого нечто иное .
Примеры в индустрии:
- Imen: Платформа для фотографов, где профессионалы могут создавать собственные модели на основе своего стиля обработки . Другие пользователи могут брать эти стили, модифицировать их под свои задачи и создавать нечто уникальное на базе чужого опыта.
- Gamma: Генератор презентаций, где каждая единица контента является блоком, который можно трансформировать . Если пользователь понимает, что презентация больше подходит для формата текстовой заметки (memo) или лендинга, ИИ переформатирует всё содержимое автоматически .
По словам Аниша Ачарии, в традиционных инструментах (вроде Google Slides) такая задача потребовала бы ручного копирования и переписывания текстов, что дает стартапам преимущество .
🔮 Будущее: Интегрированные рабочие пространства 10:38
Обсуждая будущее, Аниш Ачария отмечает, что сейчас рынок перенасыщен «инструментами одной функции» (background removers, generators), многие из которых, тем не менее, зарабатывают сотни миллионов долларов . Однако пользователям неудобно использовать пять разных сервисов (один для анимации, другой для музыки, третий для субтитров), чтобы создать один ролик.
Прогнозы развития индустрии:
- Появление комплексных платформ: Переход от разрозненных инструментов к единым креативным рабочим пространствам, интегрирующим лучшие модели для всех задач .
- Смешение форматов ввода: Возможность начать писать текст на компьютере и продолжить его голосовой диктовкой в Uber .
- Равноправие человеческого и ИИ-контента: Аниш Ачария ожидает появления платформ, где контент, созданный человеком, и контент от ИИ будут восприниматься как «равноправные граждане» .
Джастин Мур подчеркивает важность гибридного подхода: например, инфлюенсер должен иметь возможность отредактировать видео с собой и тут же добавить сгенерированные ИИ перебивки (B-roll) в одном рабочем процессе . Собеседники приходят к выводу, что лента, состоящая только из ИИ-контента, малоинтересна; истинная ценность — в «турбо-заряде» человеческого творчества возможностями технологий .
Аниш Ачария заключает, что темпы изменений за последний год поражают: «Я просто не могу представить, где мы будем через пять лет, учитывая такую скорость» .