Эпоха AI Native: почему Amazon победил Sears, а новые стартапы могут победить Google

a16z (Andreessen Horowitz) 10,9 тыс. 14 мин 5 мин 11.06.2024
Главное

В индустрии технологий наметился фундаментальный сдвиг: на смену продуктам, в которые искусственный интеллект внедряется как дополнительная функция («AI augmented»), приходят решения, построенные вокруг ИИ как центрального элемента («AI native»). Партнеры венчурного фонда a16z Аниш Ачария и Джастин Мур обсуждают, почему гиганты рынка рискуют проиграть новым стартапам и как меняется рабочий процесс современных специалистов и создателей контента.

🏛️ Проблема «наследства» и преимущество AI Native 0:00

Один из главных вопросов, волнующих индустрию: смогут ли действующие технологические гиганты (инкумбенты) захватить рынок ИИ, обладая огромными данными, штатом инженеров и капиталом . По мнению Аниша Ачарии, в большинстве случаев наиболее интересные и прорывные продукты будут представлять собой совершенно новые интерфейсы, которые стали возможны только благодаря развитию искусственного интеллекта.

Собеседники отмечают, что за последние 18–24 месяца многие компании начали внедрять ИИ в существующие продукты, однако зачастую это выглядит как простая попытка «втиснуть» новую технологию в старые рамки . Аниш Ачария выделяет ключевые отличия:

Джастин Мур приводит пример неудачного переноса старых форматов в цифровую среду — «Zoom-вечеринки» (happy hours) . По её мнению, простое нахождение людей в видео-квадратиках — это тупиковый путь адаптации, так как существуют более эффективные способы цифрового взаимодействия.

📄 Смерть «пустого листа» 2:23

Первая важная характеристика нативных ИИ-продуктов — решение проблемы страха перед чистым листом. Инструменты нового поколения радикально сокращают время от идеи до первого черновика, с которым уже можно работать .

В качестве примеров Аниш Ачария приводит следующие компании:

🎭 Мультимодальность и мультимедийность 3:44

Второй столп AI Native продуктов — это мультимодальность, то есть одновременное объединение различных типов входных данных и медиаформатов для создания конечного продукта .

Ярким примером здесь выступает компания HeyGen. По словам Аниша Ачарии, её успех обусловлен интеграцией нескольких моделей:

  1. Визуальная модель, которая анализирует фото и видео пользователя, имитируя мимику и движения глаз .
  2. Аудиомодель, воссоздающая голос конкретного человека.
  3. Алгоритм синхронизации губ (lip-sync), обеспечивающий реалистичность видео-аватара .

Такое объединение разрозненных технологий в единый продукт позволяет создавать контент, который был бы невозможен при использовании ИИ только как дополнения.

🎰 Итерация вместо «одноразовой» генерации 4:39

Джастин Мур и Аниш Ачария критикуют подход «одноразовой» генерации (one-shot generation), который часто встречается в продуктах Meta и других крупных игроков. По мнению Аниша Ачарии, генерация картинок «в один клик» — это скорее развлекательная функция или «фишка» (gimmick), а не инструмент для глубокой работы .

Проблемы «одноразового» подхода:

В противовес этому нативные ИИ-компании, такие как Pika Labs (генератор видео), внедряют инструменты итерации. Пользователь может выбрать конкретного персонажа или область в сгенерированном клипе и переделать только эту часть, сохраняя остальной контекст .

🛠️ Доработка внутри платформы (Refinement) 6:11

Четвертый аспект — возможность доведения продукта до финального качества внутри одной среды. Аниш Ачария отмечает, что в нативных приложениях функции строятся вокруг модели, а не наоборот .

Примеры глубокой интеграции:

Аниш Ачария утверждает, что лучшие команды сейчас крайне избирательны в выборе и настройке моделей, стремясь создать «магическую» версию продукта с нуля. Он полагает, что Google Calendar, скорее всего, не будет переизобретен самой корпорацией Google, так как их задача — сделать текущий календарь чуть лучше, а не создавать принципиально новый интерфейс, основанный, например, только на голосе .

🔄 Ремиксинг и трансформация контента 8:16

Пятый элемент — это ремиксинг, способность мгновенно превращать один вид контента в другой. Аниш Ачария называет это ядром того, что делает ИИ особенным: возможность взять что угодно и мгновенно сделать из этого нечто иное .

Примеры в индустрии:

По словам Аниша Ачарии, в традиционных инструментах (вроде Google Slides) такая задача потребовала бы ручного копирования и переписывания текстов, что дает стартапам преимущество .

🔮 Будущее: Интегрированные рабочие пространства 10:38

Обсуждая будущее, Аниш Ачария отмечает, что сейчас рынок перенасыщен «инструментами одной функции» (background removers, generators), многие из которых, тем не менее, зарабатывают сотни миллионов долларов . Однако пользователям неудобно использовать пять разных сервисов (один для анимации, другой для музыки, третий для субтитров), чтобы создать один ролик.

Прогнозы развития индустрии:

  1. Появление комплексных платформ: Переход от разрозненных инструментов к единым креативным рабочим пространствам, интегрирующим лучшие модели для всех задач .
  2. Смешение форматов ввода: Возможность начать писать текст на компьютере и продолжить его голосовой диктовкой в Uber .
  3. Равноправие человеческого и ИИ-контента: Аниш Ачария ожидает появления платформ, где контент, созданный человеком, и контент от ИИ будут восприниматься как «равноправные граждане» .

Джастин Мур подчеркивает важность гибридного подхода: например, инфлюенсер должен иметь возможность отредактировать видео с собой и тут же добавить сгенерированные ИИ перебивки (B-roll) в одном рабочем процессе . Собеседники приходят к выводу, что лента, состоящая только из ИИ-контента, малоинтересна; истинная ценность — в «турбо-заряде» человеческого творчества возможностями технологий .

Аниш Ачария заключает, что темпы изменений за последний год поражают: «Я просто не могу представить, где мы будем через пять лет, учитывая такую скорость» .

💬 Цитаты

«Перенос Sears на веб-сайт не сделал его лучше Amazon. Amazon был новым способом поиска и покупки вещей, ставшим возможным благодаря интернету.»

Аниш Ачария 01:43

«Мы ожидаем увидеть платформы, которые позволят относиться к человеческому и ИИ-контенту как к равным гражданам.»

Аниш Ачария 12:25
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AI Native
Продукты, в которых искусственный интеллект является центральным и неотъемлемым элементом архитектуры и интерфейса.
Incumbents (Инкумбенты)
Крупные, давно существующие на рынке компании, занимающие доминирующее положение в своей нише.
One-shot generation
Процесс создания контента ИИ за одну попытку без возможности точечного редактирования результата.
Multimodal
Способность системы ИИ работать одновременно с разными типами данных: текстом, изображениями, видео и звуком.
📊 Цифры
⚖️ Другая сторона
Стартапы и бизнес a16z Andreessen Horowitz AI Native HeyGen Eleven Labs