Аравинд из Perplexity: «Задавать правильные вопросы — новый навык будущего»

Silicon Valley Girl 881 тыс. 38 мин 9 мин 17.11.2023
Главное

В новом интервью на канале Silicon Valley Girl Марина Могилко побеседовала с Аравиндом, бывшим исследователем OpenAI и сооснователем революционного поискового стартапа Perplexity. История его успеха — это классический путь технологического предпринимателя: от изучения искусственного интеллекта в ведущих лабораториях мира до создания продукта, способного пошатнуть многолетнюю монополию Google. Собеседники подробно обсудили, как зародилась идея нового поисковика, с какими трудностями столкнулась команда и почему стартапы имеют колоссальное преимущество перед ИТ-гигантами в эпоху ИИ.

🇮🇳 Из Ченнаи в Беркли: академические корни 0:13

Путь Аравинда начался в индийском городе Ченнаи, откуда он переехал в США примерно в 2017 году. Ченнаи в ИТ-кругах в шутку называют «городом ботаников» (nerd city). Аравинд объясняет эту специфику местной культурой: по его словам, даже на стадионах во время матчей по крикету публика ведет себя как интеллектуалы, оценивая тактику игры глубже, чем просто поддерживая домашнюю команду.

Главной кузницей ИТ-кадров региона выступает Индийский институт технологий в Мадрасе (IIT Madras). Как утверждает Аравинд, это местный аналог Массачусетского технологического института (MIT) или Стэнфорда. Чтобы поступить туда на факультет компьютерных наук или электротехники, сотням тысяч абитуриентов приходится сдавать сложнейший общенациональный экзамен. Именно в этом институте будущий предприниматель развил свои базовые инженерные навыки.

Большинство выпускников IIT уезжают в США ради магистратуры и последующей работы в технологической индустрии, однако Аравинд выбрал более редкий путь — академическую карьеру и защиту докторской степени (PhD). Его целью стала лаборатория Калифорнийского университета в Беркли (UC Berkeley), обладавшая одной из лучших программ по искусственному интеллекту в мире. В этой же лаборатории под руководством профессора Питера Аббеля учились будущие лидеры индустрии. Среди них был Джон Шульман, ставший впоследствии главным исследователем проекта ChatGPT в OpenAI, а также авторы ключевой технологии RLHF — обучения нейросетей на основе обратной связи от человека.

🚀 Кремниевая лихорадка и рождение идеи ИИ-поиска 5:24

Несмотря на изначально академический настрой, Аравинд быстро заразился атмосферой Кремниевой долины. По его воспоминаниям, уже через пару месяцев после приезда друзья посоветовали ему посмотреть комедийный сериал «Кремниевая долина». Проект оказался на удивление реалистичным: Аравинд признается, что многие курьезные ситуации из сериала впоследствии буквально дословно повторились в его собственной предпринимательской практике.

Переломным моментом для основателя стала летняя стажировка в лаборатории DeepMind в 2019 году. Пока утренние процессы обучения моделей выполнялись на серверах, вечера Аравинд проводил в библиотеке компании за чтением книг «Как работает Google» и «In The Plex». Огромное впечатление на него произвели слова сооснователя Google Ларри Пейджа. Пейдж утверждал, что в мире есть всего два эффективных способа реализовать по-настоящему амбициозное видение: остаться профессором или создать собственную компанию. Обычная работа в корпорациях, по мнению Пейджа, слишком часто заставляет фокусироваться на краткосрочных целях вместо масштабных прорывов.

Вдохновившись темой интернет-поиска, Аравинд связался с исследователем из Google Ашишем Васвани, одним из изобретателей архитектуры Transformers. Эта нейросетевая архитектура кардинально изменила обработку данных, позволив ИИ глубоко анализировать текст на уровне отдельных слов, фраз и предложений. Аравинд осознал, что глубокое понимание человеческого языка способно уничтожить необходимость в сложнейших алгоритмах ранжирования ссылок, которые Google выстраивал десятилетиями.

После защиты диссертации Аравинд устроился в OpenAI, где застал запуск GitHub Copilot. Наблюдая за тем, как программисты мгновенно внедряют ИИ-ассистента в работу, и понимая, что продукт коммерчески успешен, он осознал: идеальный момент для создания стартапа наступил. Аравинд решился на «холодную» рассылку писем известным инвесторам Нату Фридману и Эльаду Гилу. К его удивлению, оба согласились вложить деньги в проект, когда у основателей не было даже четко сформулированной идеи. Уволившись из OpenAI, Аравинд пригласил в команду Джонни Хо — чемпиона мира по конкурентному программированию, работавшего ранее в Quora и Tower Research. К нему присоединился Денис, бывший инженер поисковика Bing. На первых порах сооснователи работали за минимальную зарплату, делая ставку на долю в капитале и долгосрочный масштаб бизнеса.

🛠️ Ошибки управления и случайное открытие Slack-бота 14:17

На старте молодая команда совершенно не умела управлять бизнесом. Первые бытовые трудности возникли, когда первому нанятому инженеру по имени Ник потребовалось оформить медицинскую страховку. Основатели столкнулись с запутанной американской системой соплатежей и франшиз, а стандартные поисковые запросы в Google выдавали лишь бесконечную рекламу страховых брокеров. В качестве решения команда на скорую руку собрала внутреннего Slack-бота на базе модели GPT-3.5 от OpenAI, который помогал отвечать на административные вопросы. Как отмечает Аравинд, это совпало со знаменитым советом Пола Грэма из Y Combinator: искать соответствие продукта рынку (product-market fit) через решение собственных насущных проблем.

Однако базовый ИИ-бот страдал от сильных галлюцинаций и часто выдумывал факты. Тогда сооснователь Денис предложил техническое решение: напрямую подключить языковую модель к поисковому веб-индексу. Продукт мгновенно трансформировался в диалоговую поисковую систему. Команда запустила Discord-сервер для друзей и знакомых, и первые же пользователи восторженно заявили, что получившийся инструмент работает гораздо лучше привычного Google.

Параллельно создатели экспериментировали с глубоким поиском по социальной сети Twitter (ныне X), представив демо-версию, способную анализировать социальные графы, связи и лайки пользователей. Этот прототип настолько впечатлил ИТ-сообщество, что стартап без труда привлек топовых ангел-инвесторов, среди которых были главный ИИ-ученый Meta Ян Лекун, экс-директор по автопилоту Tesla Андрей Карпатый и глава ИИ-направления Google Джефф Дин. К сожалению, перспективное направление Twitter-поиска, обеспечившее проекту колоссальную виральность, пришлось полностью закрыть. Причиной послужило резкое изменение правил и условий использования API платформы после того, как компанию Twitter приобрёл Илон Маск.

📈 Уроки удержания аудитории и дерзкий вызов гигантам 16:53

Команда долго не находила в себе смелости объявить о публичном запуске полноценного поисковика, опасаясь прямого столкновения с Google. Ситуацию переломил совет одного из инвесторов. По воспоминаниям Аравинда, тот прагматично отметил, что маленькая компания ничем не рискует: в случае провала они останутся незамеченными, но в случае успеха выиграют всё. Инвестор поставил простую задачу — привлечь хотя бы первую тысячу пользователей.

Ситуация обострилась 30 ноября, когда OpenAI выпустила ChatGPT, мгновенно ставший сенсацией. Проанализировав продукт конкурентов, Аравинд и его коллеги заметили ключевые недостатки: нейросеть требовала постоянной авторизации, не имела прямого доступа к актуальной информации из интернета и регулярно галлюцинировала. Поняв, что свободная ниша существует, Perplexity запустился ровно через неделю после конкурента — 7 декабря. Основатели выбрали абсолютно противоположную рынку стратегию: вместо закрытых списков ожидания и красивых демо-роликов они представили минималистичную страницу с одной лишь поисковой строкой, работавшей без всякой регистрации. Продукт сразу выдавал готовые структурированные ответы, снабженные строгими академическими цитатами со ссылками на первоисточники. Успех был настолько громким, что основатель корпорации Dell Майкл Делл лично написал Аравинду в LinkedIn, похвалив приложение.

В процессе развития продукта Аравинд вывел для себя важное правило удержания аудитории, сформулированное инвестором Натом Фридманом. Смысл концепции заключается в следующем:

Размышляя о будущем технологий, Аравинд затронул тему влияния ИИ на когнитивные способности человека. По его мнению, повсеместный доступ к мгновенным ответам не убьет критическое мышление, а лишь переведет его на новый уровень: ценность сместится от владения ответами к умению задавать правильные вопросы. Проводя аналогию, гость утверждает, что лучший дата-сайентист сегодня ценен не умением писать SQL-код (с этим отлично справляется ИИ), а способностью формулировать высокоуровневые гипотезы и выстраивать цепочки глубоких уточняющих запросов. Именно поэтому в Perplexity внедрили систему автоматического предложения последующих вопросов (follow-up suggestions) и гиперссылок, стимулирующих пользователя углубляться в тему.

🛡️ Текущий этап: бизнес-модель, фейки и защита от Google 25:05

На текущем этапе Perplexity обрабатывает более 3 миллионов поисковых запросов ежедневно, а ежемесячная активная аудитория (MAU) приблизилась к отметке в 10 миллионов человек. Сервис популярен в США, Великобритании, Канаде, а также в неанглоязычных странах, таких как Япония, Германия и Франция, поскольку платформа автоматически переводит найденную в глобальной сети информацию на язык запроса пользователя. Десятки тысяч пользователей уже оформили платную подписку ради расширенного доступа к ИИ-помощнику Co-pilot. При этом компания пока не вышла на чистую прибыль из-за колоссальных затрат на вычислительную инфраструктуру и аренду мощных моделей. Руководство стартапа сознательно использует стратегию Джеффа Безоса из Amazon: агрессивно наращивать пользовательскую базу и параллельно планомерно снижать себестоимость инфраструктуры за счет технических оптимизаций. Ключевыми KPI для компании остаются объем ежедневных запросов, удержание пользователей и темпы роста аудитории, в то время как монетизация рассматривается как приятный вторичный бонус.

Одной из главных технологических проблем Аравинд считает борьбу с фейковыми новостями. Для ее решения, по его словам, необходимы две вещи: развитие способности ИИ к сложным логическим рассуждениям для сопоставления противоречивых источников и возвращение к старым алгоритмическим идеям вроде PageRank от Google. Стартап пытается разработать автоматическую систему оценки индекса доверия и авторитетности интернет-доменов, полностью исключающую субъективный человеческий фактор.

Аравинд выражает довольно радикальный взгляд на проблему цензуры в ИИ, не соглашаясь со многими специалистами по безопасности (alignment), которые запрещают чат-ботам отвечать на чувствительные или опасные вопросы вроде инструкций по созданию взрывчатки. Предприниматель убежден, что если подобная информация открыто доступна в Google, YouTube, книгах или показана в фильме «Оппенгеймер», ИИ не должен брать на себя функции тоталитарного юридического цензора. По его мнению, задача разработчиков — обучать людей правильно использовать дополненный интеллект, а не решать за них, что им позволено знать, а что нет.

Обсуждая юридические риски, Аравинд указывает на уязвимость крупных ИТ-корпораций перед американским законодательством, в частности Статьей 230 (Section 230), которая освобождает соцсети от ответственности за публикации пользователей. Эта норма не распространяется на контент, сгенерированный искусственным интеллектом. Из-за этого сервисы вроде Google Bard или Bing Chat сильно рискуют: по словам Аравинда, если ИИ выдаст ложную или порочащую информацию, взятую с сомнительного SEO-сайта, любой гражданин может засудить технологического гиганта. Стартапы в этом плане обладают огромным преимуществом, так как несут гораздо меньше изначальной юридической ответственности и могут позволить себе экспериментировать, развертывать технологии на ходу и выявлять реальные проблемы на практике.

Главной защитой Perplexity от копирования со стороны Google Аравинд называет жесткие рамки бизнес-модели поискового гиганта. По его мнению, чтобы внедрить полноценный ИИ-поиск без традиционных ссылок, Google придется уничтожить собственную «дойную корову» — контекстную рекламу с оплатой за клик (Performance Advertising). В ходе антимонопольных разбирательств в Конгрессе США всплыли внутренние документы, доказывающие, что рекламные топ-менеджеры Google намеренно перенасыщали выдачу баннерами ради выполнения квартальных планов финансовых директоров. У стартапа нет обязательств перед акционерами по защите рекламных доходов, нет гигантского масштаба, поэтому он может совершать дорогие ошибки, использовать неоптимальную инфраструктуру и концентрироваться исключительно на пяти главных осях идеального продукта.

По оценке Аравинда, вероятность для стартапа преуспеть хотя бы в одном из этих направлений составляет около 10%. Шанс стать лучшим во всех пяти измерениях одновременно равен одному на 100 000, а с учетом необходимости непрерывных изнурительных итераций — одному на миллион. Тем не менее, именно фанатичная страсть, а не огромный капитал, позволяет небольшим командам успешно конкурировать с триллионными корпорациями. В завершение беседы Марина Могилко выразила мнение, что Perplexity вряд ли полностью сотрет Google с лица земли, но определенно станет одним из ключевых и влиятельнейших игроков на глобальном рынке поисковых технологий будущего.

💬 Цитаты

«В мире Кремниевой долины люди действительно отвечают на холодные письма и помогают вам.»

«Критическое мышление сместится в сторону понимания того, какие именно вопросы нужно задавать.»

👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
RLHF
Метод обучения языковых моделей на основе подкрепления с помощью обратной связи от человека.
PageRank
Алгоритм расчета авторитетности веб-страниц, изначально разработанный основателями Google.
Section 230
Положение закона США о этике в сфере коммуникаций, защищающее интернет-платформы от исков за пользовательский контент.
MAU
Количество уникальных пользователей, зашедших в приложение или сервис в течение месяца.
📊 Цифры
🗓 Хронология
  1. 2017 Аравинд переезжает из Индии в США для поступления в аспирантуру Беркли.
  2. 2018 Аравинд начинает работать исследователем в компании OpenAI.
  3. 2019 Летняя стажировка Аравинда в лаборатории DeepMind, где рождается его интерес к технологиям поиска.
  4. 30 ноября 2022 OpenAI выпускает ChatGPT, спровоцировав глобальный бум генеративного искусственного интеллекта.
  5. 7 декабря 2022 Официальный минималистичный публичный запуск поисковой системы Perplexity.
⚖️ Другая сторона
Искусственный интеллект Аравинд Perplexity OpenAI Google Марина Могилко