Алекс Иммерман из a16z: «В 2024 году битва за ИИ переместится от моделей к пользовательскому опыту»

a16z (Andreessen Horowitz) 7,1 тыс. 17 мин 4 мин 27.12.2023
Главное

Венчурный фонд Andreessen Horowitz (a16z) представил свой ежегодный прогноз «Big Ideas 2024», в котором ключевое место занимает трансформация рынка потребительского искусственного интеллекта. Генеральный партнер фонда Алекс Иммерман (Alex Immerman) утверждает, что эпоха, когда технологическое превосходство модели было единственным залогом успеха, подходит к концу, уступая место битве за лучший пользовательский опыт (UX).

🚀 Смена парадигмы: от производительности модели к дизайну интерфейса 1:34

По мнению Алекса Иммермана, 2023 год прошел под девизом «каждая минута, потраченная не на разработку модели — это минута, потраченная впустую» . В тот период лидерами рынка становились компании, создававшие собственные проприетарные модели: OpenAI (ChatGPT), Character.ai, Google (Bard/Gemini) и Midjourney . Дифференциация строилась исключительно на качестве генерации текста или изображений.

Однако в 2024 году ситуация радикально меняется. Иммерман выделяет несколько факторов, способствующих этому сдвигу:

Инвестиционный тезис Иммермана заключается в том, что теперь стартапы могут строить прорывные продукты на базе чужих моделей, фокусируясь на уникальных сценариях использования и процессах, а не на базовой технологии .

🏰 UX как новый «защитный ров» стартапа 3:09

На вопрос о том, что станет главным фактором защиты бизнеса (moat), Алекс Иммерман отвечает однозначно: пользовательский опыт. Он проводит историческую параллель с переходом на мобильные платформы в 2010 году .

Основные аргументы Иммермана в пользу UX:

Партнер a16z не согласен с тем, что дизайн легко скопировать. По его мнению, именно сочетание данных пользователя, его истории и глубоко продуманного интерфейса создает устойчивое преимущество .

📉 Демократизация и экономика ИИ-приложений 5:53

Одной из главных проблем ИИ-стартапов в 2023 году была высокая стоимость инференса (запуска моделей). По словам Иммермана, большинство компаний были вынуждены использовать платные подписки или транзакционные модели, чтобы просто покрыть расходы на облачные вычисления .

Ситуация в 2024 году, по прогнозу a16z, будет развиваться следующим образом:

  1. Стоимость доступа к качественным моделям (как закрытым, так и открытым) будет неуклонно падать .
  2. Разработчики смогут создавать бесплатные приложения для широкой аудитории, что расширит «верхнюю часть воронки» для привлечения пользователей .
  3. Модели превратятся в «новый примитив» — инфраструктурный слой, аналогичный облачному хранилищу, геолокации или платежным шлюзам .

Иммерман сравнивает ИИ с финтех-сектором: как платежные рельсы являются стандартом для всех, так и модели станут общим ресурсом, а победит тот, кто создаст лучший рабочий процесс (workflow) вокруг них .

🛠 Проблема «оберток» и пример Perplexity 7:40

В индустрии существует опасение, что любой стартап без собственной модели — это лишь временная «обертка» над OpenAI, которую гигант может уничтожить в любой момент . Алекс Иммерман считает, что предприниматели должны фокусироваться на своих уникальных сильных сторонах, а не пытаться соревноваться в разработке инфраструктуры .

Ключевые рекомендации для фаундеров:

Хотя Perplexity использует сторонние модели, они добавили функции, создающие уникальный опыт:

Это делает продукт полноценным сервисом, а не просто интерфейсом для вызова API . Еще одна аналогия от a16z: разница между сотнями приложений-компасов в App Store и компанией Uber, которая использовала геолокацию для создания принципиально нового сервиса .

🎮 Будущее: Мультиплеер, агрегация и NPC 10:36

Иммерман выделяет несколько направлений, которые вызывают у него наибольший интерес в 2024 году:

1. Агрегация моделей и «мультиплеер» Примером служит платформа Poe от Quora. Она объединяет ведущие модели (GPT-4, Claude, Llama, Stable Diffusion) в одном интерфейсе . Особенность Poe в том, что пользователи могут делиться своими диалогами с друзьями, создавая совместный опыт взаимодействия с ИИ .

2. Мультимодальные AI-друзья Ожидается переход от текстового общения к голосовому и визуальному. По мнению Иммермана, мы увидим более реалистичных «ИИ-друзей», которые не просто слушают текст, но и реагируют на интонации и речь в реальном времени .

3. Интеллектуальные NPC в играх В таких платформах, как Fortnite или Roblox, неигровые персонажи (NPC) станут по-настоящему интерактивными. Они смогут слушать разговоры игроков и вести уникальные, персонализированные беседы, адаптированные под контекст конкретной игровой сессии .

🌐 Роль Open Source и паралич инфраструктурного слоя 13:14

Алекс Иммерман ссылается на прогноз генерального директора Hugging Face, согласно которому в 2024 году Open Source модели достигнут паритета с лучшими закрытыми решениями . Такие модели, как Llama (Meta) и Mistral, уже демонстрируют высокую конкурентоспособность .

Это давление со стороны открытого ПО вынуждает проприетарных разработчиков снижать цены. Рост активности в сегменте Open Source уже порождает интересные продукты:

В завершение Иммерман отмечает, что разделение слоев инфраструктуры и приложений упростит создание новых компаний. Фаундерам больше не нужно решать сложнейшую задачу построения модели, что привлечет в индустрию еще больше строителей (builders) .

💬 Цитаты

«Минута, потраченная не на разработку модели — это минута, потраченная впустую. Так говорили в 2023 году. В 2024 году все меняется.»

Алекс Иммерман 01:46

«Модели — это всего лишь новый примитив для создания приложений, такой же как хранилище данных, геолокация или платежные рельсы сегодня.»

Алекс Иммерман 07:00

«Разница между сотнями приложений-компасов в App Store и Uber заключается в том, как вы используете базовую технологию для создания новой ценности.»

Алекс Иммерман 09:54
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс (Inference)
Процесс работы уже обученной нейросети для выдачи результата пользователю.
Ров (Moat)
Конкурентное преимущество, которое защищает компанию от посягательств конкурентов.
NPC (Non-Player Character)
Персонаж в видеоиграх, который не управляется человеком.
LLM (Large Language Model)
Большая языковая модель, тип нейросети для понимания и генерации текста.
📊 Цифры
🗓 Хронология
  1. 2010 Бум мобильных приложений и появление Instagram, доказавшего важность UX.
  2. 2023 Год «битвы моделей», когда доминировали проприетарные разработки OpenAI и Google.
  3. 2024 Перенос фокуса внимания инвесторов и разработчиков с разработки моделей на пользовательский опыт.
⚖️ Другая сторона
Стартапы и бизнес Алекс Иммерман a16z Andreessen Horowitz Perplexity Open Source AI