# Эд Ануфф (DataStax): «Векторные базы данных — это ключ к внедрению ИИ в бизнес»

Источник: https://www.youtube.com/watch?v=s4aIl6CCz6U
Канал: Eye on AI
Опубликовано: 12.11.2023

---

## 🤖 ИИ и будущее данных: зачем бизнесу векторные базы данных
[[JUMP:1:32]]

Интеграция искусственного интеллекта в бизнес-процессы перестала быть футуристическим концептом и превратилась в повседневную задачу для Enterprise-сектора. Эд Ануфф, главный директор по продукту в DataStax, в беседе с ведущим подкаста *Eye on AI* Крейгом Смитом объясняет, что фундаментом для успешного внедрения ИИ-решений сегодня выступает не только сама языковая модель, но и архитектура управления данными. Ключевой технологией, решающей проблему «галлюцинаций» нейросетей, стали векторные базы данных, которые обеспечивают ИИ контекстом, необходимым для точных и персонализированных ответов.

### 🗄️ Базы данных в эпоху генеративного ИИ
[[JUMP:3:12]]

До массового распространения GPT-моделей компания DataStax была известна как создатель Cassandra — масштабируемой NoSQL-базы данных, которую используют такие гиганты, как Apple, Netflix, Uber и FedEx. По словам Ануффа, Cassandra идеально подходит для высоконагруженных систем, требующих глобального распределения данных и гибкости схем.

Однако появление ChatGPT изменило ландшафт. В отличие от самих моделей, которые «заморожены» и не имеют встроенной памяти (они работают как «черный ящик»: контекст — запрос — ответ), векторные базы данных позволяют создавать персонализированный диалог, храня историю взаимодействия.

* **Что такое вектор?** Это длинное многомерное число, представляющее собой семантическую концепцию текста.
* **Как это работает:** Векторная база данных позволяет моделям искать информацию на основе смысловой близости, а не просто по ключевым словам.

### 🔍 Борьба с «галлюцинациями»: стратегия RAG
[[JUMP:24:01]]

Одной из главных проблем LLM является «туманная память» и склонность к выдумкам. Ануфф подчеркивает, что единственным надежным способом борьбы с галлюцинациями является методология **RAG (Retrieval-Augmented Generation)** — генерация, дополненная поиском.

Суть метода заключается в том, что в момент запроса модель получает не только вопрос, но и набор достоверных фактов из базы данных, которые она должна использовать в качестве единственного источника информации. Это решает две важные задачи:

1.  **Точность:** Модель дает ответы, опираясь на предоставленный контент, а не на вероятностные предсказания.
2.  **Безопасность данных:** Конфиденциальную информацию (например, медицинские записи) не нужно вшивать в саму модель. Данные передаются «на лету» только тогда, когда это необходимо, что исключает риск «утечки» частных сведений в другие диалоги.

### 📈 Экономика ИИ и «фильтр продакшена»
[[JUMP:37:07]]

Ануфф отмечает, что сейчас индустрия находится на стадии бума экспериментов. Однако для бизнеса критически важно различать «крутые демо» и реальные продукты, работающие в продакшене.

* **Стоимость:** Векторный поиск требует примерно в 10 раз больше вычислительных мощностей, чем обычный запрос к БД. Компании должны понимать, что ИИ-фичи должны приносить доход (например, рост продаж на X%), перекрывающий расходы на вычисления.
* **Производительность:** Чтобы сократить издержки, DataStax разработала технологию JVector на базе Java, которая позволяет минимизировать потребность в дорогих GPU.
* **Бенчмарки:** Ануфф призывает не слепо верить маркетингу, а требовать от вендоров доказательств эффективности: стандартных тестов на релевантность и точность (recall), которые могут заметно падать при росте объема данных в базе.

По мнению эксперта, следующие 18 месяцев станут периодом «фильтра продакшена», когда большинство экспериментов будет отсеяно, а те, что докажут экономическую целесообразность, станут отраслевым стандартом.