# Аватар из Timescale: «PostgreSQL заменяет специализированные векторные базы данных»

Источник: https://www.youtube.com/watch?v=kUjMkzl9HCA
Канал: Eye on AI
Опубликовано: 18.11.2024

---

Современный ландшафт разработки искусственного интеллекта требует от инженеров не только знаний в области нейросетей, но и владения сложной инфраструктурой данных. В новом выпуске подкаста Eye on AI руководитель направления ИИ в компании Timescale Аватар (Avthar) объясняет, почему проверенная десятилетиями база данных PostgreSQL становится центральным узлом для умных приложений, заменяя собой россыпь узкоспециализированных инструментов.

## 🐘 Феномен PostgreSQL: 30 лет надежности и расширяемости
[[JUMP:05:01]]

PostgreSQL (часто называемая просто Postgres) — это объектно-реляционная база данных с открытым исходным кодом, чья история началась в стенах Университета Беркли как развитие проекта Ingress [04:41]. За три десятилетия своего существования система трансформировалась из академического проекта в индустриальный стандарт.

По словам Аватара, успех Postgres обусловлен двумя ключевыми факторами:

*   **Исключительная надежность:** За 30 лет эксплуатации в самых жестких условиях большинство критических ошибок были обнаружены и исправлены [05:07]. Это делает систему одной из самых стабильных платформ для хранения данных в мире.
*   **Механизм расширений (Extensions):** Архитектура Postgres позволяет независимым разработчикам внедрять новую функциональность непосредственно в ядро системы, не дожидаясь изменения основного кода [05:47].

Именно благодаря расширяемости Postgres сегодня справляется не только с традиционными SQL-запросами, но и с геопространственными данными (PostGIS), временными рядами (TimescaleDB) и векторным поиском для ИИ [06:14]. Согласно опросам Stack Overflow последних двух лет, Postgres остается самой любимой и используемой БД среди профессиональных разработчиков [06:55].

## 📈 От интернета вещей к финансовым рынкам: Опыт Timescale
[[JUMP:02:43]]

Компания Timescale началась не с создания базы данных, а с разработки платформы для интернета вещей (IoT) под названием iobEAM [12:45]. Команда столкнулась с проблемой: датчики и сенсоры генерируют колоссальные объемы данных с частотой в несколько сигналов в секунду [13:50].

Аватар описывает специфические требования к таким системам:

1.  **Высокая скорость записи:** База должна мгновенно поглощать поток данных от тысяч устройств.
2.  **Специфические запросы:** Нужно быстро получать либо «срез» состояния всей сети за последние 5 минут, либо глубокую историческую аналитику по одному объекту за месяц [14:02].
3.  **Сложные агрегации:** Вычисление средних значений, максимумов и трендов в реальном времени.

Не найдя подходящего решения, команда расширила возможности Postgres, создав TimescaleDB [03:08]. Сегодня эти технологии применяются не только в «умных» фабриках, но и в финансовом секторе. Аватар утверждает, что Timescale обеспечивает работу крупнейших криптовалютных бирж, где данные о сделках представляют собой классические временные ряды сверхвысокой плотности [16:53].

## 🧠 ИИ-революция и проблема синхронизации векторов
[[JUMP:19:09]]

С появлением ChatGPT и развитием RAG-систем (Retrieval-Augmented Generation — генерация с дополнением извлеченных данных) возник новый вызов: где хранить векторные представления данных (эмбеддинги) [19:50]? Многие компании бросились внедрять специализированные векторные базы данных (например, Pinecone), но быстро столкнулись с «инфраструктурным кошмаром».

Аватар выделяет главную проблему использования сторонних векторных БД — потерю синхронизации [25:30]. Если в основной базе данных компании обновляется информация о продукте или правилах компании, вектор в отдельной базе остается старым. Инженерам приходится строить сложные ETL-конвейеры (извлечение, преобразование, загрузка), системы очередей и мониторинга, чтобы избежать «протухания» данных в ИИ-приложении [36:59].

## 🛠 Набор инструментов PG: Превращение Postgres в ИИ-хранилище
[[JUMP:21:47]]

Timescale предложила альтернативу — концепцию «Postgres для всего». Аватар детально описал стек инструментов, которые компания разработала для упрощения жизни разработчиков:

*   **pgvector:** Стороннее расширение, создающее фундамент для работы с векторами в Postgres [23:46].
*   **PGVector Scale:** Расширение от Timescale, которое решает проблему производительности при масштабировании до миллиардов векторов. Оно использует продвинутое индексирование и статистическое бинарное квантование (Compression) для ускорения поиска [23:06].
*   **pgai:** Позволяет вызывать функции больших языковых моделей (LLM) — таких как OpenAI, Anthropic или Cohere — прямо из SQL-запроса [28:24].
*   **pgai vectorizer:** Самая свежая новинка, которая автоматически создает и обновляет эмбеддинги при изменении данных в таблице [24:52].

Пример использования pgai: модерация комментариев [32:55]. Как только пользователь пишет комментарий, срабатывает триггер внутри базы данных, LLM анализирует текст, и база сама решает, в какую таблицу (одобренных или заблокированных записей) поместить эту строку. Все происходит без написания дополнительного кода в приложении.

## 🔓 Открытый код против «вендор-лока»
[[JUMP:07:09]]

Timescale придерживается стратегии Open Source, хотя Аватар признает, что вопрос монетизации всегда актуален. Большинство ИИ-инструментов компании распространяются под максимально разрешительной лицензией Postgres в отличие от флагманской TimescaleDB, имеющей ограничения для крупных облачных провайдеров [08:27].

Основной доход компании приносит управляемый облачный сервис Timescale Cloud [09:22]. Аватар подчеркивает:

1. Клиенты платят за удобство: резервное копирование, высокая доступность и автоматическое обновление «железа».
2. Отсутствие привязки к поставщику: так как это стандартный Postgres, клиент может в любой момент забрать свои данные и код, перенеся их на собственные серверы [11:24].

## 🔮 Будущее: Демократизация разработки
[[JUMP:45:31]]

Аватар отмечает, что барьер входа в мир программирования стремительно снижается благодаря ИИ-агентам и инструментам вроде Cursor или Devon [46:11]. Timescale уже внедряет функции естественного языка в свои инструменты администрирования. Например, через проект Popsicle пользователь может спросить: «Покажи мне продажи за этот месяц», — и система сама сгенерирует сложный SQL-запрос [46:55].

Для Timescale будущее ИИ неразрывно связано с открытостью. По мнению Аватара, ИИ трансформирует каждый бизнес, и использование открытых технологий — единственный способ гарантировать, что разработчики не будут «ограблены» или ограничены собственниками проприетарных платформ в долгосрочной перспективе [48:41].