Exa: Как создается «библиотекарь» для эпохи ИИ
Поисковые системы, какими мы их знаем, ограничивают возможности пользователей. Google и аналогичные платформы оптимизированы для быстрых ответов на простые запросы, но они пасуют перед задачами, требующими глубокого синтеза и анализа. Уилл Брик, основатель и генеральный директор компании Exa AI, ставит перед собой амбициозную цель: переосмыслить алгоритм поиска, превратив его из инструмента получения ссылок в интеллектуальную систему фильтрации знаний. В интервью подкасту The Cognitive Revolution Брик рассказал о создании «поисковой машины для ИИ», способной справиться с самыми сложными запросами, которые сегодня недоступны классическим «гуглилкам».
🧠 Путь основателя: от идеи к «примерному движку» 6:30
История Exa началась с осознания разрыва между мощностью современных языковых моделей (LLM) и устаревшими методами поиска информации.
- Origin: Брик и его команда решили сфокусироваться на создании базы данных нового типа — «нейронной базы знаний». Идея заключалась в том, чтобы использовать мощь LLM для понимания семантики запросов на человеческом уровне, в то время как поиск десятилетиями оставался стагнирующим.
- Переломные моменты: Команда осознала, что стандартный поиск по ключевым словам не работает, если пользователь сам не знает, что именно он ищет. Например, поиск «стартапов, применяющих ИИ в юриспруденции» превращается в кошмар из-за нерелевантной выдачи Google.
- Текущий этап: Сегодня Exa — это исследовательский стартап с собственным GPU-кластером, где компания обучает свои фундаментальные модели поиска. Продукт позиционируется как «примерный движок» (example engine): пользователю предлагается приложить пример того, что он ищет, и нейросеть находит аналогичные объекты — статьи, людей или компании.
🤖 Зачем ИИ нужен «свой» поиск? 22:31
По словам Брика, взаимодействие ИИ с поисковыми системами кардинально отличается от поведения человека.
- Сложность запросов: Человек ленив и вводит 2–3 слова. ИИ может мгновенно сгенерировать сложный, многосоставный запрос на целый абзац, описывающий мельчайшие детали задачи.
- Объемы потребления: Люди просматривают несколько результатов. ИИ может «проглотить» 100 результатов за доли секунды и синтезировать информацию из них.
- Формат выдачи: ИИ не нужны просто «заголовки и ссылки». Ему нужен доступ к полному контенту страницы, чтобы сразу начать обработку.
🛠 Технологии под капотом 27:16
В отличие от Google, который, по мнению Брика, использует «нейронное переранжирование» лишь как пост-процессинг для старых методов, Exa изначально проектирует всё «нейронным» образом.
- Нейронный PageRank: Модель обучается предсказывать, какая ссылка должна последовать за конкретным текстом. «Когда модель видит, что на Reddit люди после фразы "отличный стартап в аэрокосмической отрасли" постоянно дают конкретную ссылку, она учится связывать этот запрос с этим документом».
- Эмбеддинги (векторные представления): Это база работы системы сегодня, но Брик считает, что будущее — в выходе за пределы простых эмбеддингов, так как они теряют много информации при dot-продуктах (операции скалярного произведения).
- Собственная БД: Компания разрабатывает свои векторные базы данных, так как существующие Open Source решения не оптимизированы для сложных фильтров, которые Exa хочет накладывать на запросы «на лету».
💰 Бизнес-модель и стратегия 46:17
Несмотря на кажущуюся высокой цену ($10 за 10 000 поисков), клиенты не жалуются, так как Exa решает задачи, которые не по силам конкурентам.
- Нишевое использование: Основные клиенты используют Exa для специфических доменов: поиск кандидатов, источников для лидогенерации или анализа рынка.
- Экономия времени: Инвестиции в качественный поиск экономят колоссальное количество ресурсов на итерациях для LLM-агентов.
- Приоритеты: Брик отмечает, что компания фокусируется на миссии фильтрации мировых знаний, поэтому создание и продажа собственной Vector DB как отдельного продукта пока не является приоритетом, чтобы не отвлекаться от основной цели.
⚖️ Ответственность и будущее 1:02:15
Брик подчеркивает важность ответственного использования власти, которую дает управление доступом к знаниям.
- Философия компании: Дать пользователям полную власть получать именно то, что они просят, вместо того чтобы навязывать «правильные» результаты.
- Конкуренция: Брик верит, что Exa станет доминирующим игроком, но признает, что рынок информационного поиска будет расширяться, оставляя место и для других узкоспециализированных систем.