Как Perplexity планирует победить Google и рекламную модель AdWords

Lex Fridman 932 тыс. 3 ч 2 мин 6 мин 19.06.2024
Главное

🧠 Perplexity как «движок ответов»: новая парадигма поиска

В современном интернете грань между поисковой системой и искусственным интеллектом становится всё более размытой. Аравинд Шринивас, генеральный директор Perplexity, определяет свой продукт не просто как очередной поисковик, а как «движок ответов» (answer engine). Главное отличие от Google заключается в переходе от списка ссылок к синтезированному, связному тексту, где каждое утверждение подкреплено цитатой.

Философия академической строгости 🎓

Идея создания Perplexity выросла из академического бэкграунда основателей. Аравинд вспоминает ключевой совет своего наставника: каждое предложение в научной работе должно иметь ссылку на источник, иначе это лишь частное мнение.

Этот принцип лег в основу архитектуры системы:

Проблема «страховки» и неэффективность Google 🏥

Шринивас приводит личный пример, ставший катализатором проекта. Когда первый нанятый сотрудник спросил о медицинской страховке, Аравинд отправился в Google. Однако вместо четкого ответа он столкнулся с рекламным шумом.

  1. Страхование — это высокодоходная категория для контекстной рекламы.
  2. Google выгодно, чтобы пользователь кликал по множеству ссылок рекламодателей, а не получал мгновенный ответ.
  3. Традиционный поиск заставляет человека самостоятельно анализировать десятки страниц, чтобы собрать общую картину.

Внедрение Slack-бота на базе GPT-3.5 сначала казалось спасением, но модель начала галлюцинировать. Именно тогда возникла концепция RAG (Retrieval-Augmented Generation) — технологии, которая соединяет мощь языковых моделей с актуальностью поискового индекса.


🏗️ Технологический стек: под капотом Perplexity

Путь от вопроса до ответа занимает доли секунды, но за это время система выполняет сложнейшую оркестрацию процессов. Шринивас подробно описывает, как устроена эта «магия».

Архитектура RAG (Retrieval-Augmented Generation) 🔍

Процесс обработки запроса выглядит следующим образом:

  1. Анализ запроса: Модель интерпретирует намерение пользователя, исправляя опечатки и уточняя контекст.
  2. Поиск и извлечение: Поисковый движок находит релевантные веб-страницы.
  3. Чтение и выборка: Система вырезает наиболее подходящие абзацы текста из найденных ссылок.
  4. Синтез: LLM (Large Language Model) читает эти фрагменты и пишет лаконичный ответ, расставляя ссылки на конкретные части текста.

Роль собственного поискового робота (Perplexity Bot) 🤖

В отличие от простых «оберток» над API существующих моделей, Perplexity строит собственный индекс интернета.

Гибридное ранжирование: почему векторы — не панацея 🧬

Аравинд развенчивает миф о том, что для поиска достаточно «векторных баз данных».


💰 Бизнес-модель: можно ли победить «рекламную иглу» Google?

Обсуждение будущего неизбежно затрагивает финансовую сторону вопроса. Лекс Фридман и Аравинд подробно разбирают, почему Google находится в «ловушке собственного успеха».

«Ваша маржа — моя возможность» 📉

Шринивас цитирует Джеффа Безоса, объясняя стратегию Perplexity. Рекламная модель AdWords — величайшее изобретение в истории бизнеса, но она же является ограничением для Google.

Подписка как гарант доверия 💳

Perplexity делает ставку на модель подписки (Pro-версия), что позволяет:

  1. Давать пользователю выбор между лучшими моделями (GPT-4o, Claude 3, собственные модели Sonar).
  2. Избегать давления со стороны рекламодателей при формировании ответов.
  3. Фокусироваться на скорости и точности, а не на удержании внимания ради показа рекламы.

⚡ Одержимость задержкой (Latency) и UX

Для Аравинда скорость — это не технический параметр, а основополагающая черта продукта. Он черпает вдохновение в истории Google, где Ларри Пейдж заставлял инженеров тестировать Chrome на старых ноутбуках.

Уроки Ларри Пейджа 🐚


🚀 Будущее ИИ: Reasoning и «цепочки рассуждений»

Одним из самых захватывающих моментов беседы стало обсуждение того, как ИИ может начать думать, а не просто предсказывать следующее слово.

Метод цепочки мыслей (Chain-of-Thought) ⛓️

Аравинд объясняет, что заставляя модель проговаривать промежуточные шаги рассуждения, мы получаем гораздо более качественный результат.

Прогноз: когда наступит AGI? 🔮

Аравинд избегает называть конкретные даты, но дает важное определение «прорыва»:


👨‍💻 Личные истории и кумиры

Статья была бы неполной без человеческой стороны Аравинда. Несмотря на статус CEO успешного стартапа, он остается «фанатом» технологий.

Чему Аравинд научился у титанов:

Личный совет начинающим 💡

Аравинд подчеркивает, что в 20 лет нужно работать на износ над тем, что по-настоящему зажигает.

  1. Найдите свою дофаминовую систему: Если вы получаете удовольствие от улучшения качества поиска на 1%, вы сможете построить Google. Если только от денег — вы сдадитесь, когда станет трудно.
  2. Цените удачу: Возможность служить миллионам людей — это привилегия, которую нужно отрабатывать тяжелым трудом.
  3. Окружение: Находите тех, кто горит идеями, а не тех, кто ищет причины ничего не делать.

🏁 Итог: Интернет знаний

Аравинд видит будущее Perplexity в создании «коллективного интеллекта». Через такие инструменты, как Perplexity Pages, результаты индивидуального любопытства одного человека превращаются в структурированные статьи для других.

Цель — не просто заменить Google, а сделать человечество более склонным к поиску истины и критическому мышлению. Ведь, как говорит Шринивас, путешествие за знаниями не заканчивается после получения ответа — оно только начинается. ♾️

💬 Цитаты

«Каждое предложение в научной работе должно иметь ссылку на источник, иначе это лишь частное мнение.»

Наставник Аравинда Шриниваса

«Ваша маржа — моя возможность»

Джефф Безос (цитирует Аравинд Шринивас)

«Пользователь никогда не виноват»

Аравинд Шринивас
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RAG (Retrieval-Augmented Generation)
Технология, объединяющая поиск актуальной информации в базе данных с генеративными способностями языковой модели.
Галлюцинации ИИ
Явление, при котором языковая модель уверенно генерирует фактологически неверную или несуществующую информацию.
Headless-рендеринг
Процесс загрузки и обработки веб-страниц без графического интерфейса пользователя для индексации динамического контента.
BM25
Функция ранжирования, используемая поисковыми системами для оценки релевантности документов по частоте ключевых слов.
Chain-of-Thought
Метод рассуждения ИИ, при котором модель выполняет задачу пошагово, проговаривая логическую последовательность.
Искусственный интеллект Perplexity Аравинд Шринивас Google RAG LLM