# Эпоха AI Native: почему Amazon победил Sears, а новые стартапы могут победить Google

Источник: https://www.youtube.com/watch?v=HkOJy8rMlMw
Канал: a16z (Andreessen Horowitz)
Опубликовано: 11.06.2024

---

В индустрии технологий наметился фундаментальный сдвиг: на смену продуктам, в которые искусственный интеллект внедряется как дополнительная функция («AI augmented»), приходят решения, построенные вокруг ИИ как центрального элемента («AI native»). Партнеры венчурного фонда a16z Аниш Ачария и Джастин Мур обсуждают, почему гиганты рынка рискуют проиграть новым стартапам и как меняется рабочий процесс современных специалистов и создателей контента.

## 🏛️ Проблема «наследства» и преимущество AI Native
[[JUMP:0:00]]

Один из главных вопросов, волнующих индустрию: смогут ли действующие технологические гиганты (инкумбенты) захватить рынок ИИ, обладая огромными данными, штатом инженеров и капиталом [0:00]. По мнению Аниша Ачарии, в большинстве случаев наиболее интересные и прорывные продукты будут представлять собой совершенно новые интерфейсы, которые стали возможны только благодаря развитию искусственного интеллекта. 

Собеседники отмечают, что за последние 18–24 месяца многие компании начали внедрять ИИ в существующие продукты, однако зачастую это выглядит как простая попытка «втиснуть» новую технологию в старые рамки [0:26]. Аниш Ачария выделяет ключевые отличия:

*   **Инерция инкумбентов:** Крупные компании часто оказываются в ловушке — они не могут радикально изменить свои платформы, не рискуя существующим бизнесом или доходами [1:17].
*   **«Пришитые» функции:** Вместо переосмысления пользовательского опыта гиганты добавляют функции ИИ поверх старого интерфейса.
*   **Историческая аналогия:** Аниш Ачария сравнивает это с ранними этапами интернета: перенос каталогов ритейлера Sears на веб-сайт не сделал его лучше Amazon. Amazon изначально строился на новой бизнес-модели и способах поиска товаров, став «нативным» для интернета [1:43].

Джастин Мур приводит пример неудачного переноса старых форматов в цифровую среду — «Zoom-вечеринки» (happy hours) [1:57]. По её мнению, простое нахождение людей в видео-квадратиках — это тупиковый путь адаптации, так как существуют более эффективные способы цифрового взаимодействия.

## 📄 Смерть «пустого листа»
[[JUMP:2:23]]

Первая важная характеристика нативных ИИ-продуктов — решение проблемы страха перед чистым листом. Инструменты нового поколения радикально сокращают время от идеи до первого черновика, с которым уже можно работать [2:37].

В качестве примеров Аниш Ачария приводит следующие компании:

*   **Durable:** Позволяет создавать миллионы веб-сайтов [3:02]. Пользователь вводит базовую информацию о компании, и сервис мгновенно генерирует готовую отправную точку для дальнейшего редактирования.
*   **Vizcom:** Инструмент для промышленного дизайна и инженерии [3:16]. Инженеры из обувных и автомобильных компаний загружают бумажные наброски, а система создает первый профессиональный рендер. По словам Аниша Ачарии, это дает специалисту результат, готовый на 80%, что значительно снижает барьер для начала проекта [3:29].

## 🎭 Мультимодальность и мультимедийность
[[JUMP:3:44]]

Второй столп AI Native продуктов — это мультимодальность, то есть одновременное объединение различных типов входных данных и медиаформатов для создания конечного продукта [3:44].

Ярким примером здесь выступает компания **HeyGen**. По словам Аниша Ачарии, её успех обусловлен интеграцией нескольких моделей:

1.  Визуальная модель, которая анализирует фото и видео пользователя, имитируя мимику и движения глаз [4:00].
2.  Аудиомодель, воссоздающая голос конкретного человека.
3.  Алгоритм синхронизации губ (lip-sync), обеспечивающий реалистичность видео-аватара [4:14].

Такое объединение разрозненных технологий в единый продукт позволяет создавать контент, который был бы невозможен при использовании ИИ только как дополнения.

## 🎰 Итерация вместо «одноразовой» генерации
[[JUMP:4:39]]

Джастин Мур и Аниш Ачария критикуют подход «одноразовой» генерации (one-shot generation), который часто встречается в продуктах Meta и других крупных игроков. По мнению Аниша Ачарии, генерация картинок «в один клик» — это скорее развлекательная функция или «фишка» (gimmick), а не инструмент для глубокой работы [4:51].

Проблемы «одноразового» подхода:

*   **Эффект игрового автомата:** Если результат не идеален (например, готов на 95%), пользователю приходится нажимать кнопку генерации заново в надежде на лучший исход, но вместо этого он может получить результат, который хуже на 30% [5:30].
*   **Отсутствие контроля:** Пользователь не может исправить конкретную деталь, не переделывая всё изображение или видео целиком [5:45].

В противовес этому нативные ИИ-компании, такие как **Pika Labs** (генератор видео), внедряют инструменты итерации. Пользователь может выбрать конкретного персонажа или область в сгенерированном клипе и переделать только эту часть, сохраняя остальной контекст [5:18].

## 🛠️ Доработка внутри платформы (Refinement)
[[JUMP:6:11]]

Четвертый аспект — возможность доведения продукта до финального качества внутри одной среды. Аниш Ачария отмечает, что в нативных приложениях функции строятся *вокруг* модели, а не наоборот [7:13].

Примеры глубокой интеграции:

*   **Krea:** Позволяет не только создавать ИИ-арт, но и масштабировать (upscale) его прямо на рабочем холсте, превращая набросок в отполированное произведение [6:36].
*   **Eleven Labs:** Начав с генерации голоса, компания создала полноценный продукт для создания аудиокниг [6:48]. Пользователю не нужно уходить на сторонние ресурсы, чтобы собрать готовый проект из отдельных звуковых фрагментов.

Аниш Ачария утверждает, что лучшие команды сейчас крайне избирательны в выборе и настройке моделей, стремясь создать «магическую» версию продукта с нуля. Он полагает, что Google Calendar, скорее всего, не будет переизобретен самой корпорацией Google, так как их задача — сделать текущий календарь чуть лучше, а не создавать принципиально новый интерфейс, основанный, например, только на голосе [8:04].

## 🔄 Ремиксинг и трансформация контента
[[JUMP:8:16]]

Пятый элемент — это ремиксинг, способность мгновенно превращать один вид контента в другой. Аниш Ачария называет это ядром того, что делает ИИ особенным: возможность взять что угодно и мгновенно сделать из этого нечто иное [8:42].

Примеры в индустрии:

*   **Imen:** Платформа для фотографов, где профессионалы могут создавать собственные модели на основе своего стиля обработки [9:07]. Другие пользователи могут брать эти стили, модифицировать их под свои задачи и создавать нечто уникальное на базе чужого опыта.
*   **Gamma:** Генератор презентаций, где каждая единица контента является блоком, который можно трансформировать [9:33]. Если пользователь понимает, что презентация больше подходит для формата текстовой заметки (memo) или лендинга, ИИ переформатирует всё содержимое автоматически [9:46]. 

По словам Аниша Ачарии, в традиционных инструментах (вроде Google Slides) такая задача потребовала бы ручного копирования и переписывания текстов, что дает стартапам преимущество [10:00].

## 🔮 Будущее: Интегрированные рабочие пространства
[[JUMP:10:38]]

Обсуждая будущее, Аниш Ачария отмечает, что сейчас рынок перенасыщен «инструментами одной функции» (background removers, generators), многие из которых, тем не менее, зарабатывают сотни миллионов долларов [11:05]. Однако пользователям неудобно использовать пять разных сервисов (один для анимации, другой для музыки, третий для субтитров), чтобы создать один ролик.

Прогнозы развития индустрии:

1.  **Появление комплексных платформ:** Переход от разрозненных инструментов к единым креативным рабочим пространствам, интегрирующим лучшие модели для всех задач [11:29].
2.  **Смешение форматов ввода:** Возможность начать писать текст на компьютере и продолжить его голосовой диктовкой в Uber [11:42].
3.  **Равноправие человеческого и ИИ-контента:** Аниш Ачария ожидает появления платформ, где контент, созданный человеком, и контент от ИИ будут восприниматься как «равноправные граждане» [12:09].

Джастин Мур подчеркивает важность гибридного подхода: например, инфлюенсер должен иметь возможность отредактировать видео с собой и тут же добавить сгенерированные ИИ перебивки (B-roll) в одном рабочем процессе [12:38]. Собеседники приходят к выводу, что лента, состоящая только из ИИ-контента, малоинтересна; истинная ценность — в «турбо-заряде» человеческого творчества возможностями технологий [13:14].

Аниш Ачария заключает, что темпы изменений за последний год поражают: «Я просто не могу представить, где мы будем через пять лет, учитывая такую скорость» [13:55].