# Берналь Хименес Гутьеррес: как архитектура гиппокампа делает ИИ умнее

Источник: https://www.youtube.com/watch?v=YQauz14Pvfk
Канал: The Cognitive Revolution
Опубликовано: 19.07.2024

---

## HippoRAG: Биологически вдохновенная революция в памяти LLM 🧠
[[JUMP:0:25]]

Современные большие языковые модели (LLM) обладают впечатляющими знаниями, но часто пасуют перед задачами, требующими «длинных» логических выводов из разрозненных источников. Традиционные системы RAG (Retrieval-Augmented Generation), основанные на простом поиске семантически похожих фрагментов, не справляются с многоходовыми вопросами, где ответ скрыт в связях между документами, а не в одном конкретном абзаце. Берналь Хименес Гутьеррес, аспирант Университета Огайо и автор HippoRAG, предлагает принципиально новый подход, черпающий вдохновение в нейроанатомии человеческого гиппокампа.

### 🧬 Гиппокамп как чертеж для ИИ
[[JUMP:1:18]]

По словам Хименеса Гутьерреса, классические методы RAG напоминают грубую силу: если ответ не содержится в одном документе, системе приходится выполнять множество последовательных и дорогостоящих итераций поиска. Человеческая память работает иначе: гиппокамп действует как ассоциативный индекс, хранящий «указатели» на реальные воспоминания, распределенные в неокортексе.

Основные компоненты HippoRAG, имитирующие биологические структуры:

*   **Неокортекс (LLM):** Моделирует локальные способности к рассуждению и извлечению признаков из текста.
*   **Парагиппокампальные области (Retrieval Encoders):** Обеспечивают двусторонний мост между неокортексом и гиппокампом.
*   **Гиппокамп (Knowledge Graph + Personalized PageRank):** Использует графовую структуру для хранения ассоциаций и алгоритм для быстрого поиска релевантных концептов.

Ключевой особенностью системы является **патерн-комплишен** (завершение паттерна) — способность восстанавливать целостную картину, основываясь на частичных данных, благодаря ассоциативным связям в графе.

### 🛠 Как работает HippoRAG под капотом
[[JUMP:18:55]]

Процесс HippoRAG состоит из двух этапов: индексации и онлайн-поиска.

1.  **Автономная индексация (Offline):**
    *   Документы проходят через LLM для извлечения сущностей и отношений (Open Information Extraction).
    *   Строится Knowledge Graph, где узлы — сущности, а ребра — отношения между ними.
    *   Используются кодировщики для создания «ребер синонимии», что позволяет системе связывать различные формулировки одного и того же понятия.

2.  **Онлайн-поиск (Online):**
    *   При поступлении запроса из него извлекаются ключевые сущности.
    *   Запускается алгоритм Personalized PageRank (PPR), который «блуждает» по графу, начиная с обнаруженных сущностей, пока не выявит наиболее вероятные релевантные области.
    *   Результаты этой «прогулки» определяют, какие именно фрагменты корпуса будут переданы LLM для финального ответа.

Хименес Гутьеррес отмечает, что использование GPT-3.5 для этапа извлечения позволило существенно снизить затраты при сохранении высокой точности.

### 📊 Результаты и перспективы
[[JUMP:40:01]]

По словам автора, HippoRAG демонстрирует производительность, сопоставимую с итеративными методами поиска, но при десятикратном снижении затрат и времени. При объединении с «наивным» RAG наблюдается прирост качества на 7–8%, что эксперт называет формой самокоррекции модели.

Будущее развитие системы, по мнению Хименеса Гутьерреса, должно идти по нескольким направлениям:

*   **Улучшение навигации:** Замена простого алгоритма PPR на более интеллектуальные методы обхода графа, возможно, с привлечением самой LLM (хотя это может увеличить стоимость).
*   **Обработка неявных знаний:** HippoRAG пока лучше всего работает с «явными» фактами; для концептуального синтеза (например, «почему этот финал истории счастливый?») требуются механизмы рефлексии, аналогичные тем, что используются в проектах вроде AI Town.
*   **Синтез идей:** Автор полагает, что идеальная система будет использовать комбинацию методов HippoRAG, Raptor и автоматизированного построения семантической паутины.

Хименес Гутьеррес подчеркивает, что текущий успех небольших моделей не означает отказ от крупных — наоборот, путь к эффективности часто лежит через дистилляцию знаний из более мощных систем. Хотя текущая реализация сфокусирована на тексте, сама архитектура модульности, по его мнению, является ключом к преодолению разрыва в логических способностях ИИ.