Аравинд Сринивас: «Если google.com станет чат-ботом, Perplexity закроется»

Eye on AI 3,2 тыс. 53 мин 7 мин 14.03.2024
Главное

Появление диалоговых поисковых систем кардинально меняет привычные способы работы с информацией в интернете. В новом эпизоде подкаста Eye on AI сооснователь и генеральный директор Perplexity AI Аравинд Сринивас рассказывает историю создания своего стартапа, ставшего одним из самых заметных конкурентов технологических гигантов. Путь от академического исследователя до руководителя компании стоимостью более полумиллиарда долларов демонстрирует, как правильный выбор времени и радикальное изменение пользовательского интерфейса способны пошатнуть доминирование традиционных поисковых систем.

🎓 Истоки: академический путь и зарождение мечты

<a class="ts" data-seconds="135" href="#t=135" title="Смотреть с 2:15" aria-label="Смотреть с 2:15"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

Аравинд Сринивас родился и вырос в Индии, где провел первые 22 года своей жизни. Его академический путь начался в Индийском институте технологий в Мадрасе (IIT Madras), одном из ведущих инженерных вузов страны, где он получил степень бакалавра в области электротехники со специазацией в компьютерных науках и машинном обучении. Еще во время учебы в бакалавриате ему удалось пройти стажировку в лаборатории лауреата премии Тьюринга Йошуа Бенжио, одного из пионеров глубокого обучения. Этот опыт вдохновил Аравинда продолжить исследовательскую деятельность и поступить в аспирантуру Университета Калифорнии в Беркли, чтобы совместить глубокое обучение с обучением с подкреплением (RL), поскольку в то время лаборатория DeepMind совершала прорыв за прорывом в этой области.

Связи Беркли с индустрией искусственного интеллекта помогли Аравинду устроиться на стажировку в OpenAI после первого года аспирантуры. Там он познакомился с ведущими учеными, включая Илью Суцкевера и Алека Рэдфорда, которые в тот момент создавали первую версию модели GPT. Осознание того, что эта технология принципиально отличается от всего существовавшего ранее, заставило Аравинда изменить направление диссертации с обучения с подкреплением на генеративные модели, которые тогда назывались обучением без учителя.

Важным этапом в формировании предпринимательского мышления будущего CEO стала последующая стажировка в лондонском офисе DeepMind. Днем Аравинд запускал вычислительные задачи, а по вечерам засиживался в корпоративной библиотеке, где наткнулся на книги «Как работает Google» Эрика Шмидта и «In the Plex» Стивена Леви. До этого момента Аравинд считал, что крупный бизнес создают исключительно недоучившиеся студенты вроде Марка Цукерберга, Билла Гейтса или Стива Джобса. Однако пример Ларри Пейджа и Сергея Брина, которые основали легендарную компанию, будучи именно аспирантами, изменил его мировоззрение. Вдохновившись этим, он обратился к изобретателю архитектуры Transformer Ашишу Васвани (который впоследствии стал инвестором Perplexity) и провел совместное исследование в Google Brain, изучая Трансформеры как универсальную вычислительную систему.

⚡ Переломные моменты: от исследовательской работы к «сейчас или никогда»

<a class="ts" data-seconds="527" href="#t=527" title="Смотреть с 8:47" aria-label="Смотреть с 8:47"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

По окончании аспирантуры Аравинд Сринивас столкнулся с дилеммой: продолжать научную карьеру или основать компанию. В тот момент модель GPT-3 воспринималась многими скорее как игрушка, стабильных бизнес-моделей на базе генеративного ИИ не существовало, а сам исследователь имел визовые ограничения. Он принял решение остаться в науке и перешел в OpenAI для исследования диффузионных моделей.

Однако вскоре ситуация на рынке изменилась. Появление таких продуктов, как Jasper, Copy.ai и GitHub Copilot, созданных на базе GPT-3.5, показало, что генеративные технологии способны приносить огромную выручку — порой даже больше, чем зарабатывала сама OpenAI на тот момент. Для Аравинда, которому тогда было около 27–28 лет, это стало сигналом к действию. Как признается сам предприниматель, он осознавал, что способность работать по 100 часов в неделю без выгорания и быстро усваивать сложнейшие концепты не вечна, а появление семьи в будущем создаст дополнительные ограничения.

Решение было принято по принципу «сейчас или никогда». Аравинд отправил «холодные» сообщения в LinkedIn легендарному инвестору Эладу Гилу и в Twitter (X) Нату Фридману. Текст обращения был предельно честным: Аравинд указал, что работает исследователем в OpenAI, хочет запустить бизнес, но не имеет конкретной продуктовой идеи или понимания рынка. К его удивлению, Элад Гил ответил в течение часа, а Нат Фридман также быстро поддержал инициативу. Инвесторы согласились вложить деньги в основателя еще до того, как у него появился четкий план продукта. Совместно с друзьями им удалось собрать первый раунд ангельского финансирования в размере 2–2,5 млн долларов. Сделка была закрыта в сентябре 2022 года — за несколько месяцев до релиза ChatGPT, радикально изменившего весь ИИ-ландшафт.

Команда сооснователей сформировалась из сильных специалистов с комплементарными навыками:

🔄 Первые ошибки: галлюцинации чат-ботов и радикальный пивот продукта

<a class="ts" data-seconds="1110" href="#t=1110" title="Смотреть с 18:30" aria-label="Смотреть с 18:30"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

Изначально у основателей не было опыта создания продуктов, и первой версией Perplexity стал обычный чат-бот для Slack, напоминающий ChatGPT. Инструмент создавался для личных нужд команды, однако разработчики быстро столкнулись с ключевым недостатком больших языковых моделей — галлюцинациями. Модель часто выдумывала факты, что делало её ненадежной. Тогда у Дениса Яраца возникла идея привязать ответы ИИ к реальным веб-ссылкам. По аналогии с научной и журналистской ethics, где каждое утверждение должно сопровождаться источником, команда внедрила систему цитирования в ИИ-интерфейс, выпустив продукт в виде бота для Discord.

Обратная связь от первых пользователей изменила траекторию развития стартапа. Люди начали заявлять, что этот инструмент работает лучше, чем традиционный поиск Google. Потребители указали на важное различие: если ChatGPT хорош для брейншторминга и генерации контента (где галлюцинации могут восприниматься как фича), то продукт Perplexity ориентирован на максимальную точность. Вместо того чтобы вводить ключевые слова в Google, открывать десятки вкладок и самостоятельно анализировать тексты, пользователь получает готовый, синтезированный ИИ ответ со ссылками на первоисточники.

💡 Главные уроки: Дилемма инноватора и уязвимости технологических гигантов

<a class="ts" data-seconds="1546" href="#t=1546" title="Смотреть с 25:46" aria-label="Смотреть с 25:46"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

Аравинд Сринивас признает, что на этапе подписания соглашения о раунде серии A испытывал серьезный страх перед конкуренцией со стороны Microsoft, когда в сеть утекли скриншоты обновленного поисковика Bing с интеграцией GPT-4. Однако, по мнению главы Perplexity, Microsoft не смогла реализовать свое технологическое преимущество из-за ряда критических ошибок в исполнении:

По оценке Сриниваса, Microsoft рассматривает ИИ лишь как инструмент для увеличения доли своего браузера и дистрибуции других сервисов, в то время как Perplexity фокусируется исключительно на качестве ответов. Переименование Bing Chat в Microsoft Co-pilot лишь подтверждает, что первоначальная стратегия работы с массовым потребителем провалилась, сместив фокус на корпоративный сектор.

Аналогичные проблемы Аравинд видит и у Google. По его мнению, корпорация совершает регулярные ошибки в позиционировании, постоянно проводя ребрендинг и выпуская конкурирующие между собой продукты внутри одной экосистемы (Google SGE, Bard, Gemini, Duet AI). Google продвигает Gemini как «партнера по мышлению», пытаясь конкурировать с ChatGPT во всех сферах сразу, тогда как Perplexity удерживает жесткий фокус на точности поиска. По мнению спикера, Google технически не может занять эту нишу, поскольку превращение главной страницы google.com в интерфейс прямых ответов мгновенно уничтожит их собственный рекламный бизнес, завязанный на список из «10 синих ссылок». Падение стоимости акций Google на 6% из-за отставания рекламной выручки от ожиданий Уолл-стрит наглядно иллюстрирует проявление «дилеммы инноватора».

🚀 Текущий этап: собственная инфраструктура, open-source и pplx API

<a class="ts" data-seconds="1952" href="#t=1952" title="Смотреть с 32:32" aria-label="Смотреть с 32:32"><svg viewBox="0 0 24 24" width="14" height="14" fill="currentColor" aria-hidden="true"><path d="M8 5v14l11-7z"/></svg></a>

Для обеспечения независимости от гигантов Perplexity развивает собственную поисковую инфраструктуру. Компания не использует официальный API от Google и не ограничивается простым сбором информации со страниц поисковой выдачи, так как это привело бы к высокой задержке (latency) и копированию проблем с SEO-спамом. Команда самостоятельно обходит (краулит) веб-страницы, строит собственный поисковый индекс и ранжирует сайты. На текущий этап, по оценке Аравинда, Perplexity проиндексировала от 70% до 80% наиболее ценного и полезного контента в интернете.

Технологический стек компании включает в себя:

Касаясь юридических споров в индустрии, таких как иск газеты New York Times к OpenAI, Сринивас выражает понимание позиции издателей. По его мнению, аргументы NYT справедливы, поскольку ChatGPT обучает модели на чужих текстах и воспроизводит контент в финальном интерфейсе без указания источников, фактически лишая медиа трафика и рекламных доходов. В отличие от этого подхода, Perplexity изначально строит продукт на прямой атрибуции и направлении пользователей на сайты правообладателей. Компания уже платит ряду поставщиков данных за доступ к API, хотя глобальные лицензионные соглашения со СМИ пока не подписаны.

Текущий этап развития компании характеризуется диверсификацией бизнес-моделей. Помимо пользовательских подписок, Perplexity активно развивает направление pplx API. Этот интерфейс позволяет сторонним разработчикам (которых уже насчитывается около 10 000) использовать онлайн-модели ИИ без фиксированного момента отсечки знаний (knowledge cut-off), так как система динамически обращается к поисковому индексу стартапа. Внедрение API строится на базе открытых моделей Llama 2 от Meta и решений от компании Mistral (Mistral, Mixtral). Аравинд Сринивас подчеркивает, что использование open-source моделей критически важно для автономии бизнеса от OpenAI, с которой они напрямую конкурируют за подписки пользователей. В планах компании — за счет привлеченных инвестиций (включая средства Джеффа Безоса) расширить доступ к GPU, повысить лимиты API и перейти к полноценному обучению собственных специализированных моделей на основе накопленных пользовательских данных.

💬 Цитаты

«Если бы google.com выглядел точно как Bard сегодня, Perplexity бы закрылась. Но тогда и Google бы закрылся.»

Аравинд Сринивас 32:32

«По сути, если бы Wikipedia и ChatGPT завели ребенка и использовали все данные из интернета, этот продукт выглядел бы точно как Perplexity.»

Аравинд Сринивас 02:02
👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Галлюцинация ИИ
Феномен, при котором большая языковая модель уверенно генерирует ложные или вымышленные факты.
Дилемма инноватора
Ситуация, когда успешная компания не может внедрить новые технологии, так как они разрушают её текущую прибыльную бизнес-модель.
Векторная база данных
Специализированное хранилище данных, оптимизированное для поиска похожих объектов по их математическим векторам (эмбеддингам).
Краулинг (Crawling)
Процесс автоматического обхода веб-страниц поисковыми роботами для сбора информации и её последующей индексации.
📊 Цифры
🗓 Хронология
  1. 2017 Аравинд Сринивас переезжает из Индии в США для учебы в аспирантуре Калифорнийского университета в Беркли.
  2. Июнь-июль 2022 Начало переговоров с инвесторами Эладом Гилом и Натом Фридманом без готовой идеи продукта.
  3. Сентябрь 2022 Закрытие ангельского раунда инвестиций в размере 2-2,5 млн долларов и официальный запуск компании.
  4. Конец 2022 Выход ChatGPT от OpenAI, изменивший пользовательские ожидания от интерфейсов взаимодействия с ИИ.
⚖️ Другая сторона
Искусственный интеллект Perplexity AI Аравинд Сринивас Google search Дилемма инноватора