Апурва Джоши: «Управление памятью — ключ к созданию обучающихся ИИ-агентов»

DeepLearning.AI 6,1 тыс. 32 мин 4 мин 27.03.2025
Главное

В рамках конференции AI Dev 25 Апурва Джоши (Apoorva Joshi), специалист по связям с разработчиками в MongoDB, представила глубокий анализ одной из самых критических проблем современной разработки ИИ — управления памятью агентов. В то время как большинство современных LLM-приложений ограничиваются хранением истории чата, переход к полноценным ИИ-агентам требует системного подхода к долгосрочной памяти. Джоши утверждает, что именно умение эффективно сохранять, извлекать и обновлять знания превратит ИИ из простого чат-бота в интеллектуального партнера, способного учиться на собственном опыте.

🤖 От классических агентов к эре LLM 2:16

Апурва Джоши напоминает, что концепция ИИ-агентов зародилась задолго до появления современных языковых моделей. В 90-е годы доминировали агенты с обучением с подкреплением (Reinforcement Learning), которые выбирали действия из заранее определенного набора для максимизации вознаграждения . Именно такие системы обыгрывали гроссмейстеров в шахматы и го.

Однако сегодня под «ИИ-агентами» подразумеваются системы на базе LLM. По мнению спикера, современный агент состоит из пяти ключевых компонентов:

🧠 Человеческая память как архитектурный шаблон 7:43

Чтобы построить по-настоящему умных агентов, Джоши предлагает обратиться к когнитивной психологии. Она выделяет несколько типов человеческой памяти, которые необходимо переложить на рельсы программного обеспечения:

  1. Краткосрочная и рабочая память: в ИИ-агентах это контекстное окно модели . Здесь хранятся промежуточные вычисления, текущие инструкции и результаты выполнения инструментов.
  2. Семантическая память: долгосрочное хранение фактов. Для агента это как знания, «зашитые» в веса LLM, так и внешние базы данных (например, документация продукта) .
  3. Эпизодическая память: воспоминания о конкретных событиях. В программной реализации это последовательности действий, которые агент предпринимал для решения задач в прошлом .
  4. Процедурная память: знание о том, «как» что-то делать. Это заложено в коде агента, системных промптах и весах модели .
  5. Сенсорная память: восприятие звуков, запахов и вкусов. Джоши считает, что ИИ-агенты пока далеки от полноценной обработки таких стимулов, поэтому в текущих архитектурах этот тип памяти можно опустить .

🛠️ CRUD для памяти: жизненный цикл данных 13:45

Управление памятью ИИ-агента Апурва Джоши описывает через классическую парадигму CRUD (Create, Read, Update, Delete).

Создание памяти (Create)

Просто хранить логи всех взаимодействий неэффективно. Спикер выделяет четыре «ингредиента» для формирования качественных воспоминаний:

Важно извлекать конкретные инсайты. Например, если агент управляет персонажем в симуляции, он должен сохранять черты характера героя или значимые события, а не весь текст логов .

Извлечение (Read) 20:01

Джоши выделяет несколько стратегий поиска нужных воспоминаний:

Обновление (Update) 24:41

Память должна быть динамичной. Если пользователь дает новую инструкцию (например, «всегда добавляй строки документации к функциям»), агент должен обновить свой системный промпт или семантическую память в базе данных, чтобы использовать это правило в будущем .

Удаление (Delete) 26:01

Хранить абсолютно всё — дорого и вредно для производительности. Джоши рекомендует внедрять политики жизненного цикла данных:

📉 Практические компромиссы и риски 17:43

Внедрение сложной системы памяти неизбежно ведет к увеличению задержек. Каждое создание или обновление памяти — это дополнительный вызов LLM. Разработчикам приходится выбирать между адаптивностью агента и скоростью его ответа .

В ходе сессии вопросов и ответов Апурва Джоши затронула проблему галлюцинаций. По её мнению, если процесс согласования (reconciliation) старой и новой информации в памяти настроен некорректно, агент может начать «выдумывать» факты, основываясь на неверно интерпретированном контексте . Также она провела грань между логами и памятью: логи нужны для отладки и анализа всего массива данных, в то время как память агента должна быть лаконичной и содержать только ту информацию, которая необходима для принятия решений .

🚀 Будущее систем памяти 27:38

Апурва Джоши убеждена, что управление долгосрочной памятью является ключевым компонентом на пути к сильному ИИ (AGI). В будущем, по её прогнозу, процессы обучения на опыте могут стать частью процесса «быстрой дообучаемости» (flash tuning) самих весов моделей, но на текущем этапе внешние системы управления памятью (на базе баз данных, таких как MongoDB) остаются наиболее практичным и масштабируемым решением .

💬 Цитаты

«Представьте, если бы мы помнили только наши самые недавние разговоры и ничего больше. Мы так не работаем.»

Апурва Джоши 07:43

«Больше — не значит лучше, если вы не можете найти то, что вам нужно, и найти это быстро.»

Апурва Джоши 26:29
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
LLM-based agents
Системы ИИ, использующие большую языковую модель в качестве центрального механизма принятия решений и планирования.
Эмбеддинги
Числовые векторные представления текста, позволяющие сравнивать смысл фраз математически.
Векторный поиск
Метод поиска информации, основанный на близости смыслов (векторов), а не на точном совпадении слов.
Контекстное окно
Максимальный объем данных, который языковая модель может обработать за один раз.
📊 Цифры
🗓 Хронология
  1. 1990-е Появление первых агентов на базе обучения с подкреплением (RL).
  2. 2023 Апурва Джоши перешла на роль Developer Advocate в MongoDB.
⚖️ Другая сторона
Искусственный интеллект Apoorva Joshi MongoDB AI Agents LLM memory management Vector Search