Как стартап Perplexity AI бросает вызов монополии Google

Индустрия поисковых технологий переживает тектонический сдвиг, вызванный развитием генеративного искусственного интеллекта. В рамках подкаста The Cognitive Revolution исполнительный директор и сооснователь стартапа Perplexity AI Аравинд Сринивас рассказал о том, как небольшая команда из десяти человек бросает вызов многомиллиардной монополии Google. В центре дискуссии — уникальная продуктовая философия, вопросы снижения стоимости инфраструктуры и экономические последствия грядущей эпохи сильного ИИ (AGI).

📊 Давид против Голиафа: Экономика ИИ-поиска 1:33

На протяжении более чем десяти лет компания Google сохраняет абсолютное доминирование на мировом рынке интернет-поиска, удерживая долю около 90%. В 2022 году общая выручка технологического гиганта достигла $282 млрд, продолжая демонстрировать стабильный рост на 10% в годовом исчислении. Из этой суммы почти $60 млрд составила чистая прибыль, что эквивалентно более чем $1 млрд чистой прибыли каждую неделю. Даже масштабные инвестиции корпорации Microsoft в развитие собственного поисковика Bing практически не смогли потеснить позиции лидера.

В этих рыночных условиях стартап Perplexity AI вышел на арену, имея всего $15 млн венчурного финансирования и штат около 10 сотрудников. Главной задачей проекта стала разработка принципиально нового опыта взаимодействия с информацией.

По словам Аравинда Сриниваса, текущая бизнес-модель Google уязвима перед лицом архитектуры больших языковых моделей (LLM). Однако для самой Google полный переход на генеративные ответы сопряжен с колоссальными финансовыми рисками. При обработке миллиардов запросов в день использование ИИ-модели для каждого из них способно привести к потере миллиардов долларов прибыли из-за высокой стоимости вычислений. Меньший масштаб Perplexity AI на начальном этапе позволяет гибко экспериментировать с технологиями, постепенно оптимизируя затраты по мере роста трафика.

🔍 Философия цитирования и отказ от классического чат-бота 4:26

Основополагающая идея Perplexity AI уходит корнями в академическое прошлое его создателей. Аравинд Сринивас отмечает, что в научной среде фундаментальным правилом является обязательное цитирование источников: любой тезис должен подкрепляться ссылкой на стороннее исследование или экспериментальный результат, иначе он признается лишь субъективным мнением.

Этот принцип лег в основу первой версии продукта "Perplexity Ask", выпущенной всего через неделю-полторы после релиза ChatGPT от OpenAI. Архитектура системы объединила возможности традиционного поисковика Google и языковой модели GPT-3.5. Инструмент извлекает данные из верхних результатов поисковой выдачи, анализирует их как верифицируемые ссылки и формирует лаконичное резюме из трех предложений. Хотя в редких сценариях (так называемом «длинном хвосте» запросов) галлюцинации ИИ все еще возможны, жесткая привязка к источникам позволяет пользователям самостоятельно проверять факты.

Разрабатывая интерфейс, команда стартапа сознательно отказалась от популярного формата классических диалоговых окон (чат-ботов) с левыми и правыми «бабблами» сообщений. Аравинд Сринивас объясняет это решение следующими тезисами:

Информационный сервис должен минимизировать время пользователя, потраченное на получение знаний, а не развлекать его.
Взаимодействие в режиме чата требуется поисковой системе исключительно для уточняющих запросов (follow-up questions).
Вместо имитации человеческого общения эффективнее использовать систему связанных вопросов, аналогичную блоку "People also ask" в Google.

Главная метрика эффективности для сервиса формулируется гостем как «скорость прироста IQ» — максимизация ценности и достоверности полученной информации на единицу времени ($\Delta IQ / \Delta Time$).

🛠️ Архитектура системы: Как обогнать гигантов за субсекунду 43:23

Одной из ключевых технических характеристик Perplexity AI является скорость выдачи ответа: время генерации первого токена стабильно составляет менее одной секунды. Вопреки распространенному мнению, для достижения таких показателей не требуется непрерывно кэшировать или создавать статические эмбеддинги всего Интернета. Согласно оценкам исследователя OpenAI Бориса Пауэра, полная индексация веб-пространства с помощью эмбеддингов OpenAI обошлась бы примерно в $50 млн. Для молодого стартапа подобные траты нецелесообразны.

Технологический стек Perplexity AI работает по комбинированному принципу живого поиска:

Поступающий запрос пропускается через традиционные поисковые API (Google и Bing).
Из полученных веб-страниц оперативно извлекается текстовый контекст, релевантный сути вопроса.
Контекст подается на вход языковой модели, которая параллельно стримит готовый текст пользователю.

Стриминг ответов Аравинд Сринивас называет критически важным элементом UX-дизайна для любых продуктов на базе LLM. Ожидание готового текста в течение 4–5 секунд воспринимается аудиторией крайне негативно. Инженеры компании Деннис и Кевин внесли существенный вклад в оптимизацию этого процесса, отправив пул-реквест (PR) с реализацией потокового вывода в открытую библиотеку Triton от компании NVIDIA.

Дополнительной вехой развития интерфейса стало контекстное связывание сущностей (contextual entity linking). Если пользователь кликает на подчеркнутый термин в ответе (например, название города), система генерирует новый запрос не изолированно, а с учетом контекста предыдущего диалога, создавая своего рода динамическую персонализированную Википедию на лету.

💡 От исследователя к предпринимателю: Уроки OpenAI и Amazon 11:34

До основания собственного бизнеса Аравинд Сринивас около года работал исследователем в OpenAI. Переломным моментом, заставившим его сменить траекторию, стал 2022 год. Успех коммерциализации GitHub Copilot, высокие доходы сервиса Jasper и публичный резонанс вокруг генератора изображений DALL-E наглядно продемонстрировали, что искусственный интеллект перестал быть сугубо академической дисциплиной. Технологии стали доступны широкой публике благодаря грамотному маркетингу и снижению барьеров для входа.

В своей управленческой философии глава Perplexity AI опирается на принципы основателя Amazon Джеффа Безоса и сооснователя Google Ларри Пейджа. В частности, Безос утверждал, что прибыльность компании не должна волновать конечного клиента — его волнует лишь быстрая доставка и лучшая цена на рынке. Руководствуясь этим, Сринивас считает, что стартап обязан полностью сфокусироваться на пользователях, не навязывая им регистрацию ради сиюминутных метрик роста.

Отсутствие требования об обязательной авторизации на сайте продиктовано желанием соответствовать простоте стартовой страницы Google. По мнению Майка Кригера (сооснователя Instagram), именно необходимость создания аккаунта и интерфейсные ограничения названия \"ChatGPT\" сдерживали первоначальный взрывной охват аудитории OpenAI.

🛡️ Безопасность, цензура и галлюцинации 27:49

Проблема модерации контента и политической ангажированности ИИ-систем является одной из наиболее острых в отрасли. Аравинд Сринивас приводит в пример эксперимент венчурного инвестора Марка Андриссена, который спросил ChatGPT, способен ли ИИ определять расовую принадлежность по медицинским снимкам. Модель OpenAI уклонилась от прямого ответа, сославшись на недопустимость подобных рассуждений. В то же время Perplexity AI на тот же запрос выдал прямые ссылки на научные публикации в журнале Nature, подтверждающие техническую возможность такого анализа нейросетями.

Для минимизации обвинений в цензуре стартап внедрил функцию редактирования и кураторства источников самими пользователями. Если читатель считает определенное СМИ (например, Washington Post или New York Times) предвзятым, он может вручную исключить его из генерации ответа. При этом существуют жесткие ограничения: запросы, связанные с суицидом или причинением вреда себе, блокируются системой на уровне классификаторов.

Безопасность ИИ-ответов в Perplexity AI обеспечивается как внутренними фильтрами, так и базовой фильтрацией API от OpenAI. Качество защитных механизмов стартапа ранее было положительно отмечено командой Azure OpenAI. В будущем, как полагает Сринивас, индустрия придет к единым стандартам безопасности и общим протоколам фильтрации нежелательного контента.

Что касается монетизации, то команда планирует полностью изолировать рекламные интеграции (если они появятся) от ядра поисковой выдачи. По мнению Сриниваса, если ссылки будут ранжироваться выше только потому, что кто-то за них заплатил, сервис моментально потеряет доверие аудитории. В качестве негативного исторического примера он упоминает действия Google против платформы Yelp и другие антиконкурентные практики техногигантов прошлого.

🤖 Будущее алгоритмов: Decision Transformers и путь к AGI 1:15:37

Важной частью научного наследия Аравинда Сриниваса является разработка концепции Decision Transformers (трансформеров решений) в области обучения с подкреплением (RL). Традиционные подходы к RL, развиваемые десятилетиями такими компаниями, как DeepMind, опирались на сложные математические вычисления градиентов стратегий и Q-обучения, которые тяжело масштабировались. Идея Сриниваса заключалась в том, чтобы представить обучение с подкреплением как обычную последовательную задачу для архитектуры Transformer, где все алгоритмы и оптимизация наград заложены непосредственно в веса нейросети. Недавние исследования компании Anthropic подтвердили жизнеспособность этого подхода при обучении языковых моделей на основе отзывов людей (RLHF).

Говоря о сроках создания «слабого» искусственного общего интеллекта (weak AGI), Сринивас опирается на критерии платформы прогнозирования Metaculus. Для фиксации прорыва модель должна успешно пройти четыре теста:

Тест Тьюринга (способность поддерживать неотличимый от человеческого диалог).
Тест Винограда (разрешение местоименной неоднозначности с точностью выше 90%).
Сдача экзамена SAT на уровне 75-го процентиля исключительно по визуальным сканам страниц.
Прохождение сложной игры на Atari Montezuma's Revenge (исследование всех 24 комнат менее чем за 100 часов реального игрового времени).

По мнению Аравинда Сриниваса, интеграция визуальных моделей типа Flamingo или BLIP-2 с языковыми архитектурами позволит решить задачу с игрой Montezuma's Revenge гораздо быстрее средних прогнозов сообщества. Сам он ставит на достижение этих критериев в течение ближайших 2–3 лет, что существенно опережает пятилетний медианный прогноз аналитиков Metaculus.

Оценивая глобальные перспективы автоматизации, спикер выражает глубокое доверие руководству OpenAI и лично Сэму Альтману, отмечая, что Альтман даже не имеет прямой финансовой доли в коммерческом подразделении компании, что снижает риски искажения его стимулов. В долгосрочной перспективе изобилие искусственного интеллекта должно нивелировать разрыв в возможностях людей, превратив ИИ в персонального наставника для каждого человека. Однако в краткосрочном периоде Сринивас прогнозирует резкий рост экономического неравенства, поскольку нейросети уже позволяют сверхмалым командам из 7–8 человек добиваться колоссальных результатов без необходимости расширения штата и найма новых сотрудников.