Берналь Хименес Гутьеррес: как архитектура гиппокампа делает ИИ умнее

The Cognitive Revolution 2,5 тыс. 1 ч 21 мин 3 мин 19.07.2024
Главное

HippoRAG: Биологически вдохновенная революция в памяти LLM 🧠 0:25

Современные большие языковые модели (LLM) обладают впечатляющими знаниями, но часто пасуют перед задачами, требующими «длинных» логических выводов из разрозненных источников. Традиционные системы RAG (Retrieval-Augmented Generation), основанные на простом поиске семантически похожих фрагментов, не справляются с многоходовыми вопросами, где ответ скрыт в связях между документами, а не в одном конкретном абзаце. Берналь Хименес Гутьеррес, аспирант Университета Огайо и автор HippoRAG, предлагает принципиально новый подход, черпающий вдохновение в нейроанатомии человеческого гиппокампа.

🧬 Гиппокамп как чертеж для ИИ 1:18

По словам Хименеса Гутьерреса, классические методы RAG напоминают грубую силу: если ответ не содержится в одном документе, системе приходится выполнять множество последовательных и дорогостоящих итераций поиска. Человеческая память работает иначе: гиппокамп действует как ассоциативный индекс, хранящий «указатели» на реальные воспоминания, распределенные в неокортексе.

Основные компоненты HippoRAG, имитирующие биологические структуры:

Ключевой особенностью системы является патерн-комплишен (завершение паттерна) — способность восстанавливать целостную картину, основываясь на частичных данных, благодаря ассоциативным связям в графе.

🛠 Как работает HippoRAG под капотом 18:55

Процесс HippoRAG состоит из двух этапов: индексации и онлайн-поиска.

  1. Автономная индексация (Offline):

    • Документы проходят через LLM для извлечения сущностей и отношений (Open Information Extraction).
    • Строится Knowledge Graph, где узлы — сущности, а ребра — отношения между ними.
    • Используются кодировщики для создания «ребер синонимии», что позволяет системе связывать различные формулировки одного и того же понятия.
  2. Онлайн-поиск (Online):

    • При поступлении запроса из него извлекаются ключевые сущности.
    • Запускается алгоритм Personalized PageRank (PPR), который «блуждает» по графу, начиная с обнаруженных сущностей, пока не выявит наиболее вероятные релевантные области.
    • Результаты этой «прогулки» определяют, какие именно фрагменты корпуса будут переданы LLM для финального ответа.

Хименес Гутьеррес отмечает, что использование GPT-3.5 для этапа извлечения позволило существенно снизить затраты при сохранении высокой точности.

📊 Результаты и перспективы 40:01

По словам автора, HippoRAG демонстрирует производительность, сопоставимую с итеративными методами поиска, но при десятикратном снижении затрат и времени. При объединении с «наивным» RAG наблюдается прирост качества на 7–8%, что эксперт называет формой самокоррекции модели.

Будущее развитие системы, по мнению Хименеса Гутьерреса, должно идти по нескольким направлениям:

Хименес Гутьеррес подчеркивает, что текущий успех небольших моделей не означает отказ от крупных — наоборот, путь к эффективности часто лежит через дистилляцию знаний из более мощных систем. Хотя текущая реализация сфокусирована на тексте, сама архитектура модульности, по его мнению, является ключом к преодолению разрыва в логических способностях ИИ.

💬 Цитаты

«LLM chain of reasoning is not all you need for finding and for knowledge seeking questions really you need to have the this pre-processing knowledge consolidation of your information.»

Берналь Хименес Гутьеррес 06:46

«I think of my research as this two-way street between biology and LLMs.»

Берналь Хименес Гутьеррес 05:01
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
RAG
Метод расширения возможностей LLM путем предоставления им доступа к внешним базам знаний.
Knowledge Graph
Способ представления данных в виде сети узлов (сущностей) и связей (отношений).
Multihop reasoning
Многошаговое логическое рассуждение, требующее объединения данных из нескольких источников.
Pattern completion
Способность системы восстановить полную информацию по её фрагментарному представлению.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект HippoRAG LLM Knowledge Graph Retrieval Augmented Generation Берналь Хименес Гутьеррес