Венчурный фонд Andreessen Horowitz (a16z) представил свой ежегодный прогноз «Big Ideas 2024», в котором ключевое место занимает трансформация рынка потребительского искусственного интеллекта. Генеральный партнер фонда Алекс Иммерман (Alex Immerman) утверждает, что эпоха, когда технологическое превосходство модели было единственным залогом успеха, подходит к концу, уступая место битве за лучший пользовательский опыт (UX).
🚀 Смена парадигмы: от производительности модели к дизайну интерфейса 1:34
По мнению Алекса Иммермана, 2023 год прошел под девизом «каждая минута, потраченная не на разработку модели — это минута, потраченная впустую» . В тот период лидерами рынка становились компании, создававшие собственные проприетарные модели: OpenAI (ChatGPT), Character.ai, Google (Bard/Gemini) и Midjourney . Дифференциация строилась исключительно на качестве генерации текста или изображений.
Однако в 2024 году ситуация радикально меняется. Иммерман выделяет несколько факторов, способствующих этому сдвигу:
- Смягчение дефицита вычислительных мощностей (GPU) .
- Доступность ведущих моделей через API.
- Стремительное развитие Open Source моделей, догоняющих закрытые решения по качеству .
Инвестиционный тезис Иммермана заключается в том, что теперь стартапы могут строить прорывные продукты на базе чужих моделей, фокусируясь на уникальных сценариях использования и процессах, а не на базовой технологии .
🏰 UX как новый «защитный ров» стартапа 3:09
На вопрос о том, что станет главным фактором защиты бизнеса (moat), Алекс Иммерман отвечает однозначно: пользовательский опыт. Он проводит историческую параллель с переходом на мобильные платформы в 2010 году .
Основные аргументы Иммермана в пользу UX:
- Высокая стоимость переключения: Отличный дизайн и удобство работы заставляют пользователя привыкать к продукту, что затрудняет переход к конкурентам .
- Сетевые эффекты: Чем удобнее интерфейс для взаимодействия, тем быстрее растет база пользователей, что, в свою очередь, делает продукт ценнее .
- Сила бренда: Магический опыт взаимодействия (как это было с первыми фильтрами Instagram) формирует лояльность, которую трудно скопировать просто повторением функций .
Партнер a16z не согласен с тем, что дизайн легко скопировать. По его мнению, именно сочетание данных пользователя, его истории и глубоко продуманного интерфейса создает устойчивое преимущество .
📉 Демократизация и экономика ИИ-приложений 5:53
Одной из главных проблем ИИ-стартапов в 2023 году была высокая стоимость инференса (запуска моделей). По словам Иммермана, большинство компаний были вынуждены использовать платные подписки или транзакционные модели, чтобы просто покрыть расходы на облачные вычисления .
Ситуация в 2024 году, по прогнозу a16z, будет развиваться следующим образом:
- Стоимость доступа к качественным моделям (как закрытым, так и открытым) будет неуклонно падать .
- Разработчики смогут создавать бесплатные приложения для широкой аудитории, что расширит «верхнюю часть воронки» для привлечения пользователей .
- Модели превратятся в «новый примитив» — инфраструктурный слой, аналогичный облачному хранилищу, геолокации или платежным шлюзам .
Иммерман сравнивает ИИ с финтех-сектором: как платежные рельсы являются стандартом для всех, так и модели станут общим ресурсом, а победит тот, кто создаст лучший рабочий процесс (workflow) вокруг них .
🛠 Проблема «оберток» и пример Perplexity 7:40
В индустрии существует опасение, что любой стартап без собственной модели — это лишь временная «обертка» над OpenAI, которую гигант может уничтожить в любой момент . Алекс Иммерман считает, что предприниматели должны фокусироваться на своих уникальных сильных сторонах, а не пытаться соревноваться в разработке инфраструктуры .
Ключевые рекомендации для фаундеров:
- Не строить модель самостоятельно, если в команде нет исследователей мирового уровня (как в Character.ai или Ideogram) .
- Создавать ценность «поверх» модели. Иммерман приводит в пример Perplexity — ИИ-ассистента для поиска .
Хотя Perplexity использует сторонние модели, они добавили функции, создающие уникальный опыт:
- Низкая задержка (latency) ответа.
- Автоматическое указание источников информации.
- Предложение уточняющих вопросов.
- Мультимодальные ответы .
Это делает продукт полноценным сервисом, а не просто интерфейсом для вызова API . Еще одна аналогия от a16z: разница между сотнями приложений-компасов в App Store и компанией Uber, которая использовала геолокацию для создания принципиально нового сервиса .
🎮 Будущее: Мультиплеер, агрегация и NPC 10:36
Иммерман выделяет несколько направлений, которые вызывают у него наибольший интерес в 2024 году:
1. Агрегация моделей и «мультиплеер» Примером служит платформа Poe от Quora. Она объединяет ведущие модели (GPT-4, Claude, Llama, Stable Diffusion) в одном интерфейсе . Особенность Poe в том, что пользователи могут делиться своими диалогами с друзьями, создавая совместный опыт взаимодействия с ИИ .
2. Мультимодальные AI-друзья Ожидается переход от текстового общения к голосовому и визуальному. По мнению Иммермана, мы увидим более реалистичных «ИИ-друзей», которые не просто слушают текст, но и реагируют на интонации и речь в реальном времени .
3. Интеллектуальные NPC в играх В таких платформах, как Fortnite или Roblox, неигровые персонажи (NPC) станут по-настоящему интерактивными. Они смогут слушать разговоры игроков и вести уникальные, персонализированные беседы, адаптированные под контекст конкретной игровой сессии .
🌐 Роль Open Source и паралич инфраструктурного слоя 13:14
Алекс Иммерман ссылается на прогноз генерального директора Hugging Face, согласно которому в 2024 году Open Source модели достигнут паритета с лучшими закрытыми решениями . Такие модели, как Llama (Meta) и Mistral, уже демонстрируют высокую конкурентоспособность .
Это давление со стороны открытого ПО вынуждает проприетарных разработчиков снижать цены. Рост активности в сегменте Open Source уже порождает интересные продукты:
- EverArt — приложение для работы с изображениями.
- Can of Soup — инструменты для создания контента с использованием тонкой настройки (fine-tuning) моделей под конкретные стили или лица .
В завершение Иммерман отмечает, что разделение слоев инфраструктуры и приложений упростит создание новых компаний. Фаундерам больше не нужно решать сложнейшую задачу построения модели, что привлечет в индустрию еще больше строителей (builders) .