Аравинд Сринивас: «Если google.com станет чат-ботом, Perplexity закроется»

Появление диалоговых поисковых систем кардинально меняет привычные способы работы с информацией в интернете. В новом эпизоде подкаста Eye on AI сооснователь и генеральный директор Perplexity AI Аравинд Сринивас рассказывает историю создания своего стартапа, ставшего одним из самых заметных конкурентов технологических гигантов. Путь от академического исследователя до руководителя компании стоимостью более полумиллиарда долларов демонстрирует, как правильный выбор времени и радикальное изменение пользовательского интерфейса способны пошатнуть доминирование традиционных поисковых систем.

🎓 Истоки: академический путь и зарождение мечты

<a class="ts" data-seconds="135" href="#t=135" title="Смотреть с 2:15" aria-label="Смотреть с 2:15"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

Аравинд Сринивас родился и вырос в Индии, где провел первые 22 года своей жизни. Его академический путь начался в Индийском институте технологий в Мадрасе (IIT Madras), одном из ведущих инженерных вузов страны, где он получил степень бакалавра в области электротехники со специазацией в компьютерных науках и машинном обучении. Еще во время учебы в бакалавриате ему удалось пройти стажировку в лаборатории лауреата премии Тьюринга Йошуа Бенжио, одного из пионеров глубокого обучения. Этот опыт вдохновил Аравинда продолжить исследовательскую деятельность и поступить в аспирантуру Университета Калифорнии в Беркли, чтобы совместить глубокое обучение с обучением с подкреплением (RL), поскольку в то время лаборатория DeepMind совершала прорыв за прорывом в этой области.

Связи Беркли с индустрией искусственного интеллекта помогли Аравинду устроиться на стажировку в OpenAI после первого года аспирантуры. Там он познакомился с ведущими учеными, включая Илью Суцкевера и Алека Рэдфорда, которые в тот момент создавали первую версию модели GPT. Осознание того, что эта технология принципиально отличается от всего существовавшего ранее, заставило Аравинда изменить направление диссертации с обучения с подкреплением на генеративные модели, которые тогда назывались обучением без учителя.

Важным этапом в формировании предпринимательского мышления будущего CEO стала последующая стажировка в лондонском офисе DeepMind. Днем Аравинд запускал вычислительные задачи, а по вечерам засиживался в корпоративной библиотеке, где наткнулся на книги «Как работает Google» Эрика Шмидта и «In the Plex» Стивена Леви. До этого момента Аравинд считал, что крупный бизнес создают исключительно недоучившиеся студенты вроде Марка Цукерберга, Билла Гейтса или Стива Джобса. Однако пример Ларри Пейджа и Сергея Брина, которые основали легендарную компанию, будучи именно аспирантами, изменил его мировоззрение. Вдохновившись этим, он обратился к изобретателю архитектуры Transformer Ашишу Васвани (который впоследствии стал инвестором Perplexity) и провел совместное исследование в Google Brain, изучая Трансформеры как универсальную вычислительную систему.

⚡ Переломные моменты: от исследовательской работы к «сейчас или никогда»

<a class="ts" data-seconds="527" href="#t=527" title="Смотреть с 8:47" aria-label="Смотреть с 8:47"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

По окончании аспирантуры Аравинд Сринивас столкнулся с дилеммой: продолжать научную карьеру или основать компанию. В тот момент модель GPT-3 воспринималась многими скорее как игрушка, стабильных бизнес-моделей на базе генеративного ИИ не существовало, а сам исследователь имел визовые ограничения. Он принял решение остаться в науке и перешел в OpenAI для исследования диффузионных моделей.

Однако вскоре ситуация на рынке изменилась. Появление таких продуктов, как Jasper, Copy.ai и GitHub Copilot, созданных на базе GPT-3.5, показало, что генеративные технологии способны приносить огромную выручку — порой даже больше, чем зарабатывала сама OpenAI на тот момент. Для Аравинда, которому тогда было около 27–28 лет, это стало сигналом к действию. Как признается сам предприниматель, он осознавал, что способность работать по 100 часов в неделю без выгорания и быстро усваивать сложнейшие концепты не вечна, а появление семьи в будущем создаст дополнительные ограничения.

Решение было принято по принципу «сейчас или никогда». Аравинд отправил «холодные» сообщения в LinkedIn легендарному инвестору Эладу Гилу и в Twitter (X) Нату Фридману. Текст обращения был предельно честным: Аравинд указал, что работает исследователем в OpenAI, хочет запустить бизнес, но не имеет конкретной продуктовой идеи или понимания рынка. К его удивлению, Элад Гил ответил в течение часа, а Нат Фридман также быстро поддержал инициативу. Инвесторы согласились вложить деньги в основателя еще до того, как у него появился четкий план продукта. Совместно с друзьями им удалось собрать первый раунд ангельского финансирования в размере 2–2,5 млн долларов. Сделка была закрыта в сентябре 2022 года — за несколько месяцев до релиза ChatGPT, радикально изменившего весь ИИ-ландшафт.

Команда сооснователей сформировалась из сильных специалистов с комплементарными навыками:

Денис Ярац (Dennis Yarats) — знакомый Аравинда по аспирантуре в Беркли, эксперт в быстром создании прототипов и тестировании идей.
Джонни Хо (Johnny Ho) — бывший коллега Дениса по компании Quora и победитель мировых соревнований по спортивному программированию, взявший на себя построение бэкенд-систем и методологическую стратегию.
Аравинд Сринивас — взял на себя функции стратегического видения, позиционирования продукта, фандрейзинга, рекрутинга и общения с пользователями.

🔄 Первые ошибки: галлюцинации чат-ботов и радикальный пивот продукта

<a class="ts" data-seconds="1110" href="#t=1110" title="Смотреть с 18:30" aria-label="Смотреть с 18:30"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

Изначально у основателей не было опыта создания продуктов, и первой версией Perplexity стал обычный чат-бот для Slack, напоминающий ChatGPT. Инструмент создавался для личных нужд команды, однако разработчики быстро столкнулись с ключевым недостатком больших языковых моделей — галлюцинациями. Модель часто выдумывала факты, что делало её ненадежной. Тогда у Дениса Яраца возникла идея привязать ответы ИИ к реальным веб-ссылкам. По аналогии с научной и журналистской ethics, где каждое утверждение должно сопровождаться источником, команда внедрила систему цитирования в ИИ-интерфейс, выпустив продукт в виде бота для Discord.

Обратная связь от первых пользователей изменила траекторию развития стартапа. Люди начали заявлять, что этот инструмент работает лучше, чем традиционный поиск Google. Потребители указали на важное различие: если ChatGPT хорош для брейншторминга и генерации контента (где галлюцинации могут восприниматься как фича), то продукт Perplexity ориентирован на максимальную точность. Вместо того чтобы вводить ключевые слова в Google, открывать десятки вкладок и самостоятельно анализировать тексты, пользователь получает готовый, синтезированный ИИ ответ со ссылками на первоисточники.

💡 Главные уроки: Дилемма инноватора и уязвимости технологических гигантов

<a class="ts" data-seconds="1546" href="#t=1546" title="Смотреть с 25:46" aria-label="Смотреть с 25:46"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

Аравинд Сринивас признает, что на этапе подписания соглашения о раунде серии A испытывал серьезный страх перед конкуренцией со стороны Microsoft, когда в сеть утекли скриншоты обновленного поисковика Bing с интеграцией GPT-4. Однако, по мнению главы Perplexity, Microsoft не смогла реализовать свое технологическое преимущество из-за ряда критических ошибок в исполнении:

Размытие фокуса: Microsoft попыталась объединить свободный чат-бот и поисковик в одном интерфейсе, вместо концентрации исключительно на поиске.
Репутация бренда: бренд Bing исторически ассоциировался у потребителей с продуктом второго сорта.
Искусственные ограничения: компания заставляла пользователей устанавливать браузер Edge или создавать учетную запись Microsoft, что затормозило органический рост.
Техническая реализация: мобильные приложения Bing созданы на фреймворке Flutter, что делает их более тяжелыми, медленными и менее нативными по сравнению с приложениями Perplexity на Swift.

По оценке Сриниваса, Microsoft рассматривает ИИ лишь как инструмент для увеличения доли своего браузера и дистрибуции других сервисов, в то время как Perplexity фокусируется исключительно на качестве ответов. Переименование Bing Chat в Microsoft Co-pilot лишь подтверждает, что первоначальная стратегия работы с массовым потребителем провалилась, сместив фокус на корпоративный сектор.

Аналогичные проблемы Аравинд видит и у Google. По его мнению, корпорация совершает регулярные ошибки в позиционировании, постоянно проводя ребрендинг и выпуская конкурирующие между собой продукты внутри одной экосистемы (Google SGE, Bard, Gemini, Duet AI). Google продвигает Gemini как «партнера по мышлению», пытаясь конкурировать с ChatGPT во всех сферах сразу, тогда как Perplexity удерживает жесткий фокус на точности поиска. По мнению спикера, Google технически не может занять эту нишу, поскольку превращение главной страницы google.com в интерфейс прямых ответов мгновенно уничтожит их собственный рекламный бизнес, завязанный на список из «10 синих ссылок». Падение стоимости акций Google на 6% из-за отставания рекламной выручки от ожиданий Уолл-стрит наглядно иллюстрирует проявление «дилеммы инноватора».

🚀 Текущий этап: собственная инфраструктура, open-source и pplx API

<a class="ts" data-seconds="1952" href="#t=1952" title="Смотреть с 32:32" aria-label="Смотреть с 32:32"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

Для обеспечения независимости от гигантов Perplexity развивает собственную поисковую инфраструктуру. Компания не использует официальный API от Google и не ограничивается простым сбором информации со страниц поисковой выдачи, так как это привело бы к высокой задержке (latency) и копированию проблем с SEO-спамом. Команда самостоятельно обходит (краулит) веб-страницы, строит собственный поисковый индекс и ранжирует сайты. На текущий этап, по оценке Аравинда, Perplexity проиндексировала от 70% до 80% наиболее ценного и полезного контента в интернете.

Технологический стек компании включает в себя:

Векторную базу данных Qdrant для быстрого поиска по принципу «ключ-значение».
Собственные ИИ-эмбеддинги, обученные внутри компании, которые разделяют контент веб-страниц на смысловые фрагменты.
Алгоритмы автоматического анализа частоты цитирования доменов, выступающие в качестве современного аналога метрики PageRank.

Касаясь юридических споров в индустрии, таких как иск газеты New York Times к OpenAI, Сринивас выражает понимание позиции издателей. По его мнению, аргументы NYT справедливы, поскольку ChatGPT обучает модели на чужих текстах и воспроизводит контент в финальном интерфейсе без указания источников, фактически лишая медиа трафика и рекламных доходов. В отличие от этого подхода, Perplexity изначально строит продукт на прямой атрибуции и направлении пользователей на сайты правообладателей. Компания уже платит ряду поставщиков данных за доступ к API, хотя глобальные лицензионные соглашения со СМИ пока не подписаны.

Текущий этап развития компании характеризуется диверсификацией бизнес-моделей. Помимо пользовательских подписок, Perplexity активно развивает направление pplx API. Этот интерфейс позволяет сторонним разработчикам (которых уже насчитывается около 10 000) использовать онлайн-модели ИИ без фиксированного момента отсечки знаний (knowledge cut-off), так как система динамически обращается к поисковому индексу стартапа. Внедрение API строится на базе открытых моделей Llama 2 от Meta и решений от компании Mistral (Mistral, Mixtral). Аравинд Сринивас подчеркивает, что использование open-source моделей критически важно для автономии бизнеса от OpenAI, с которой они напрямую конкурируют за подписки пользователей. В планах компании — за счет привлеченных инвестиций (включая средства Джеффа Безоса) расширить доступ к GPU, повысить лимиты API и перейти к полноценному обучению собственных специализированных моделей на основе накопленных пользовательских данных.