Как Perplexity планирует победить Google и рекламную модель AdWords

🧠 Perplexity как «движок ответов»: новая парадигма поиска

В современном интернете грань между поисковой системой и искусственным интеллектом становится всё более размытой. Аравинд Шринивас, генеральный директор Perplexity, определяет свой продукт не просто как очередной поисковик, а как «движок ответов» (answer engine). Главное отличие от Google заключается в переходе от списка ссылок к синтезированному, связному тексту, где каждое утверждение подкреплено цитатой.

Философия академической строгости 🎓

Идея создания Perplexity выросла из академического бэкграунда основателей. Аравинд вспоминает ключевой совет своего наставника: каждое предложение в научной работе должно иметь ссылку на источник, иначе это лишь частное мнение.

Этот принцип лег в основу архитектуры системы:

Обоснованность: ИИ запрещено «фантазировать». Он должен использовать только те фрагменты текста, которые нашел поисковый робот.
Проверка фактов: Верификация происходит через сопоставление данных из нескольких независимых источников.
Цитируемость: Каждое предложение сопровождается сноской, как в Википедии, что возвращает пользователя к первоисточнику — человеческому контенту.

Проблема «страховки» и неэффективность Google 🏥

Шринивас приводит личный пример, ставший катализатором проекта. Когда первый нанятый сотрудник спросил о медицинской страховке, Аравинд отправился в Google. Однако вместо четкого ответа он столкнулся с рекламным шумом.

Страхование — это высокодоходная категория для контекстной рекламы.
Google выгодно, чтобы пользователь кликал по множеству ссылок рекламодателей, а не получал мгновенный ответ.
Традиционный поиск заставляет человека самостоятельно анализировать десятки страниц, чтобы собрать общую картину.

Внедрение Slack-бота на базе GPT-3.5 сначала казалось спасением, но модель начала галлюцинировать. Именно тогда возникла концепция RAG (Retrieval-Augmented Generation) — технологии, которая соединяет мощь языковых моделей с актуальностью поискового индекса.

🏗️ Технологический стек: под капотом Perplexity

Путь от вопроса до ответа занимает доли секунды, но за это время система выполняет сложнейшую оркестрацию процессов. Шринивас подробно описывает, как устроена эта «магия».

Архитектура RAG (Retrieval-Augmented Generation) 🔍

Процесс обработки запроса выглядит следующим образом:

Анализ запроса: Модель интерпретирует намерение пользователя, исправляя опечатки и уточняя контекст.
Поиск и извлечение: Поисковый движок находит релевантные веб-страницы.
Чтение и выборка: Система вырезает наиболее подходящие абзацы текста из найденных ссылок.
Синтез: LLM (Large Language Model) читает эти фрагменты и пишет лаконичный ответ, расставляя ссылки на конкретные части текста.

Роль собственного поискового робота (Perplexity Bot) 🤖

В отличие от простых «оберток» над API существующих моделей, Perplexity строит собственный индекс интернета.

Headless-рендеринг: Бот должен уметь читать современные сайты на JavaScript, а не только статический HTML.
Приоритетность: Система решает, какие домены сканировать чаще, основываясь на их авторитетности и свежести данных.
Политика вежливости: Соблюдение файла robots.txt и пауз между запросами, чтобы не перегружать серверы издателей.

Гибридное ранжирование: почему векторы — не панацея 🧬

Аравинд развенчивает миф о том, что для поиска достаточно «векторных баз данных».

BM25: Система до сих пор использует алгоритмы старой школы, которые учитывают частоту терминов (TF-IDF). Они эффективнее векторных эмбеддингов в поиске точных совпадений имён или специфических фактов.
Семантика: Векторы подключаются на этапе понимания глубокого смысла запроса, когда нужно найти связь между словами, не имеющими общего корня.

💰 Бизнес-модель: можно ли победить «рекламную иглу» Google?

Обсуждение будущего неизбежно затрагивает финансовую сторону вопроса. Лекс Фридман и Аравинд подробно разбирают, почему Google находится в «ловушке собственного успеха».

«Ваша маржа — моя возможность» 📉

Шринивас цитирует Джеффа Безоса, объясняя стратегию Perplexity. Рекламная модель AdWords — величайшее изобретение в истории бизнеса, но она же является ограничением для Google.

Конфликт интересов: Прямой ответ пользователю снижает вероятность клика по рекламной ссылке.
Маржинальность: Зачем Google внедрять дорогой ИИ-ответ (который стоит больше вычислительных ресурсов), если это убивает их самый прибыльный бизнес — продажу ссылок?
Облачный демпфер: Шринивас отмечает, что Google Cloud и YouTube уже приносят около 100 млрд долларов в год, что дает компании пространство для маневра, но основным «наркотиком» остается поиск.

Подписка как гарант доверия 💳

Perplexity делает ставку на модель подписки (Pro-версия), что позволяет:

Давать пользователю выбор между лучшими моделями (GPT-4o, Claude 3, собственные модели Sonar).
Избегать давления со стороны рекламодателей при формировании ответов.
Фокусироваться на скорости и точности, а не на удержании внимания ради показа рекламы.

⚡ Одержимость задержкой (Latency) и UX

Для Аравинда скорость — это не технический параметр, а основополагающая черта продукта. Он черпает вдохновение в истории Google, где Ларри Пейдж заставлял инженеров тестировать Chrome на старых ноутбуках.

Уроки Ларри Пейджа 🐚

Курсор всегда готов: Разница в миллисекунды между тем, когда пользователь кликает на строку поиска и когда появляется клавиатура, определяет успех мобильного приложения.
Тест в полете: Аравинд признается, что всегда тестирует Perplexity через медленный Wi-Fi в самолете, сравнивая его с ChatGPT и Gemini. Если приложение работает там, оно будет «летать» везде.
«Пользователь никогда не виноват»: Если человек вводит невнятный запрос, это задача системы — догадаться о намерении, а не задача пользователя — становиться «промпт-инженером».

🚀 Будущее ИИ: Reasoning и «цепочки рассуждений»

Одним из самых захватывающих моментов беседы стало обсуждение того, как ИИ может начать думать, а не просто предсказывать следующее слово.

Метод цепочки мыслей (Chain-of-Thought) ⛓️

Аравинд объясняет, что заставляя модель проговаривать промежуточные шаги рассуждения, мы получаем гораздо более качественный результат.

Алгоритм STaR: Шринивас упоминает свою работу "Self-Taught Reasoner". Идея в том, чтобы ИИ генерировал обоснования для своих ответов, а затем дообучался на тех из них, которые привели к правильному результату.
Bootstrap: Это путь к «самообучению» ИИ без бесконечного добавления человеческих данных.

Прогноз: когда наступит AGI? 🔮

Аравинд избегает называть конкретные даты, но дает важное определение «прорыва»:

Истинное открытие: Мы поймем, что ИИ стал разумен, когда он предложит принципиально новую идею, до которой не додумался ни один человек (например, новый алгоритм типа PageRank или архитектуру двигателя для Марса).
Вычислительная способность при выводе (Inference Compute): Шринивас считает, что будущее за моделями, которые «думают» дольше. Если вы задаете ИИ сложнейший вопрос по физике, он не должен отвечать мгновенно. Он может «уйти поразмышлять» на неделю, потратив огромные вычислительные ресурсы, и вернуться с гениальным решением.

👨‍💻 Личные истории и кумиры

Статья была бы неполной без человеческой стороны Аравинда. Несмотря на статус CEO успешного стартапа, он остается «фанатом» технологий.

Чему Аравинд научился у титанов:

Илон Маск: Несгибаемая воля и понимание того, что дистрибуция (прямой доступ к пользователю) важнее технологий.
Дженсен Хуанг (NVIDIA): Одержимость деталями и «продуктовая паранойя» — страх выйти из бизнеса каждый день заставляет его двигаться вперед.
Ян Лекун: Стойкость в защите своих идей (Лекун годами говорил, что обучение без учителя — это «основа торта», пока все были увлечены обучением с подкреплением).

Личный совет начинающим 💡

Аравинд подчеркивает, что в 20 лет нужно работать на износ над тем, что по-настоящему зажигает.

Найдите свою дофаминовую систему: Если вы получаете удовольствие от улучшения качества поиска на 1%, вы сможете построить Google. Если только от денег — вы сдадитесь, когда станет трудно.
Цените удачу: Возможность служить миллионам людей — это привилегия, которую нужно отрабатывать тяжелым трудом.
Окружение: Находите тех, кто горит идеями, а не тех, кто ищет причины ничего не делать.

🏁 Итог: Интернет знаний

Аравинд видит будущее Perplexity в создании «коллективного интеллекта». Через такие инструменты, как Perplexity Pages, результаты индивидуального любопытства одного человека превращаются в структурированные статьи для других.

Цель — не просто заменить Google, а сделать человечество более склонным к поиску истины и критическому мышлению. Ведь, как говорит Шринивас, путешествие за знаниями не заканчивается после получения ответа — оно только начинается. ♾️