Эд Ануфф (DataStax): «Векторные базы данных — это ключ к внедрению ИИ в бизнес»

Eye on AI 1,3 тыс. 59 мин 2 мин 12.11.2023
Главное

🤖 ИИ и будущее данных: зачем бизнесу векторные базы данных 1:32

Интеграция искусственного интеллекта в бизнес-процессы перестала быть футуристическим концептом и превратилась в повседневную задачу для Enterprise-сектора. Эд Ануфф, главный директор по продукту в DataStax, в беседе с ведущим подкаста Eye on AI Крейгом Смитом объясняет, что фундаментом для успешного внедрения ИИ-решений сегодня выступает не только сама языковая модель, но и архитектура управления данными. Ключевой технологией, решающей проблему «галлюцинаций» нейросетей, стали векторные базы данных, которые обеспечивают ИИ контекстом, необходимым для точных и персонализированных ответов.

🗄️ Базы данных в эпоху генеративного ИИ 3:12

До массового распространения GPT-моделей компания DataStax была известна как создатель Cassandra — масштабируемой NoSQL-базы данных, которую используют такие гиганты, как Apple, Netflix, Uber и FedEx. По словам Ануффа, Cassandra идеально подходит для высоконагруженных систем, требующих глобального распределения данных и гибкости схем.

Однако появление ChatGPT изменило ландшафт. В отличие от самих моделей, которые «заморожены» и не имеют встроенной памяти (они работают как «черный ящик»: контекст — запрос — ответ), векторные базы данных позволяют создавать персонализированный диалог, храня историю взаимодействия.

🔍 Борьба с «галлюцинациями»: стратегия RAG 24:01

Одной из главных проблем LLM является «туманная память» и склонность к выдумкам. Ануфф подчеркивает, что единственным надежным способом борьбы с галлюцинациями является методология RAG (Retrieval-Augmented Generation) — генерация, дополненная поиском.

Суть метода заключается в том, что в момент запроса модель получает не только вопрос, но и набор достоверных фактов из базы данных, которые она должна использовать в качестве единственного источника информации. Это решает две важные задачи:

  1. Точность: Модель дает ответы, опираясь на предоставленный контент, а не на вероятностные предсказания.
  2. Безопасность данных: Конфиденциальную информацию (например, медицинские записи) не нужно вшивать в саму модель. Данные передаются «на лету» только тогда, когда это необходимо, что исключает риск «утечки» частных сведений в другие диалоги.

📈 Экономика ИИ и «фильтр продакшена» 37:07

Ануфф отмечает, что сейчас индустрия находится на стадии бума экспериментов. Однако для бизнеса критически важно различать «крутые демо» и реальные продукты, работающие в продакшене.

По мнению эксперта, следующие 18 месяцев станут периодом «фильтра продакшена», когда большинство экспериментов будет отсеяно, а те, что докажут экономическую целесообразность, станут отраслевым стандартом.

💬 Цитаты

«Если вы действительно хотите исключить галлюцинации, вы просто говорите модели: используй свои способности к рассуждению, но не используй свои знания.»

«Большинство людей, которые приходят к нам сейчас, приходят не за Cassandra, а за векторными базами данных.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RAG (Retrieval-Augmented Generation)
Технология, при которой модель получает доступ к внешним данным для формирования более точных ответов.
Векторная база данных
Тип хранилища, оптимизированный для работы с векторами — математическими представлениями концепций.
Cassandra
Масштабируемая NoSQL-база данных, предназначенная для работы с огромными объемами распределенных данных.
Инференс
Процесс использования обученной модели для получения предсказаний или ответов.
Галлюцинации ИИ
Случаи, когда модель уверенно генерирует фактически неверную информацию.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект DataStax Vector Database Retrieval Augmented Generation Cassandra LLM