Как Джун Сун Пак создал город автономных генеративных агентов

Развитие больших языковых моделей открыло неожиданные горизонты в моделировании человеческого поведения и создании автономных цифровых сущностей. В новом выпуске подкаста The TWIML AI Podcast ведущий Сэм Черрингтон обсудил с исследователем из Стэндфордского университета Джуном Суном Паком концепцию генеративных агентов, способных имитировать социальные взаимодействия в открытом мире. Эта работа не просто меняет подход к проектированию игровых персонажей, но и возрождает давнюю мечту на стыке искусственного интеллекта и человеко-компьютерного взаимодействия.

🎓 От стартапа к научным прорывам: путь Джуна Суна Пака 0:38

Путь Джуна Суна Пака в сферу машинного обучения начался с неудачи: сразу после окончания колледжа он развивал собственный стартап, который в итоге закрылся. Переезд в Пало-Альто, расположенный рядом со Стэндфордским университетом, помог молодому предпринимателю найти новое призвание в академической среде. По мнению исследователя, научный поиск в сфере искусственного интеллекта во многом похож на создание стартапа или произведения искусства: в обоих случаях ключевыми элементами являются личная ответственность за идею и стремление выразить свои мысли через работающий продукт.

Джун Сун Пак присоединился к департаменту компьютерных наук Стэндфорда в качестве приглашенного исследователя. Ему довелось работать под руководством профессора Джеймса Ландея, который сейчас занимает пост исполнительного директора Института человекоцентричного искусственного интеллекта Стэндфорда (HAI). В этот период Ландей, Фей-Фей Ли и другие ведущие ученые университета закладывали основы нового взгляда на технологии. На формирование научных интересов гостя также повлияли профессор Джефф Хэнкок и Акосуа, ставшая впоследствии профессором Пенсильванского университета.

Основная философия созданного в Стэндфорде института HAI строится вокруг роли человека во взаимодействии с передовыми технологиями. Джун Сун Пак вспоминает, что стандартные сценарии применения ИИ, такие как улучшение классификации данных или модерация контента, казались ему прагматичными, но мало вдохновляющими с точки зрения взаимодействия. Главной целью его работы стало расширение технических границ ИИ, чтобы понять, на какие глубокие интерактивные возможности способна эта технология в пяти- или десятилетней перспективе.

🧠 Возвращение к истокам: синергия HCI и искусственного интеллекта 4:47

Современные исследования генеративных агентов находятся на стыке классического ИИ и человеко-компьютерного взаимодействия (HCI). Джун Сун Пак отмечает, что его команда стремится решать фундаментальные проблемы, которые оставались нерешенными на протяжении десятилетий. Одной из таких задач является создание «правдоподобных агентов» (believable agents), способных естественно общаться друг с другом и с пользователями в открытых мирах на протяжении длительного времени.

Эта концепция восходит к истокам когнитивной психологии и ранней компьютерной науки. По словам гостя, его вдохновляют идеи таких первопроходцев, как:

Аллен Ньюэлл
Герберт Саймон

В середине прошлого века эти ученые создавали первые когнические архитектуры и модели. В те времена дисциплины HCI и ИИ развивались неразрывно, опираясь на качественную психологию. Джун Сун Пак считает, что современные технологии больших языковых моделей позволяют вернуться к этим некогда забытым масштабным концепциям и попытаться реализовать их на новом техническом уровне.

До появления генеративного ИИ поведение неигровых персонажей (NPC) в индустрии видеоигры жестко кодировалось вручную. Как подчеркивает ведущий Сэм Черрингтон, разработчики до сих пор повсеместно используют традиционные методы контроля поведения:

Движки правил (rules engines)
Поведенческие деревья (behavioral trees)
Конечные автоматы (state machines)

Главное преимущество современных больших языковых моделей, по мнению Джуна Суна Пака, заключается в том, что они обучались на колоссальных массивах данных, включая Википедию и социальные сети, благодаря чему глубоко закодировали паттерны человеческого поведения. Модель способна воспроизводить то, как ведет себя художник перед жестким дедлайном, как студент готовится к сдаче научной статьи или из каких шагов состоит типичное утреннее расписание человека — от чистки зубов до приготовления завтрака.

🎭 Загадка «эмерджентности» и здравого смысла 8:42

Вопрос о том, обладают ли большие языковые модели собственным мировоззрением, здравым смыслом или «моделью психического человека» (theory of mind), остается открытым. Джун Сун Пак указывает на то, что в академической среде регулярно выходят противоречащие друг другу публикации. Одни исследователи утверждают, что модели успешно демонстрируют понимание мотивов окружающих, в то время как другие доказывают, что при минимальном изменении промпта или параметров вся иллюзия понимания исчезает.

В своих проектах команда Стэндфорда опирается на прагматичное допущение: языковые модели действительно кодируют и воспроизводят человеческое поведение, что подтверждается эмпирическими тестами. По словам гостя, независимые группы исследователей приходят к аналогичным выводам: в определенных сценариях ИИ выдает реакции, практически идентичные ответам реальных участников-людей.

Отдельно Джун Сун Пак затронул недавнюю дискуссию вокруг природы так называемого «эмерджентного» (внезапно проявляющегося) поведения нейросетей. В научном сообществе активно обсуждалась работа стэндфордских коллег гостя под руководством профессора Санми Койехо. Авторы этой статьи утверждают, что эмерджентные свойства ИИ — это во многом артефакт выбранных метрик оценки. При правильном масштабировании графики эффективности превращаются из резких скачков в предсказуемые линейные функции, подчиняющиеся законам масштабирования.

Несмотря на эти выводы, Джун Сун Пак полагает, что элемент неожиданности в поведении ИИ сохраняется. Главное изменение заключается в трансформации отношений человечества с ИИ-системами: если раньше инженеры создавали алгоритмы под строго определенную задачу, то теперь возможности и скрытые способности моделей приходится изучать и открывать уже после завершения их обучения.

🏡 Городок из 25 агентов: как симулировать человеческое общество 17:34

В рамках своего исследования ученые создали виртуальный Sims-подобный мир, в котором поселили 25 генеративных агентов. Оценка успешности такой симуляции строится на критерии «правдоподобности» (believability). Исследователи разделяют два уровня правдоподобности:

Базовый уровень: логичность действий отдельного персонажа в коротком промежутке времени, например, выполнение утренних процедур и прогулка до офиса пешком.
Продвинутый уровень: способность группы агентов демонстрировать сложные коллективные социальные эффекты в долгосрочной перспективе.

В качестве промежуточного этапа перед созданием генеративных агентов команда Джуна Суна Пака разработала проект «Social Simulacra» (Социальные симулякры). Система моделировала поведение пользователей в закрытых онлайн-сообществах — например, на платформе для художников. ИИ успешно воспроизводил реплики обычных авторов, ответы комментаторов и даже деструктивное поведение троллей, что позволило использовать симуляцию для обучения модераторов соцсетей.

В основном эксперименте с 25 агентами, которые свободно общались и занимались своими делами в течение двух виртуальных дней, исследователи зафиксировали три ключевые формы эмерджентного социального поведения:

Распространение информации (information diffusion) — агенты узнавали друг от друга новости, например, о проходящих выборах.
Формирование отношений (relationship formation) — персонажи запоминали собеседников, возобновляли контакты и меняли свое отношение к ним со временем.
Координация действий (action coordination) — агенты смогли самостоятельно организовать вечеринку, разослав приглашения и собравшись в назначенное время в одном месте.

Этот подход тесно связан с агентным моделированием (agent-based modeling), применяемым в вычислительных социальных науках. Задав простые правила для индивидуального поведения одной единицы, ученые смогли воспроизвести известные по социологическим исследованиям макроэффекты человеческого коллектива, не программируя их напрямую.

По мнению Джуна Суна Пака, в будущем подобные симуляции можно будет запускать на десятилетия. Теоретически, если поместить агентов в доисторическую эпоху, можно проверить, способны ли они самостоятельно прийти к созданию денежной системы для торговли. Однако исследователь признает методологическую сложность: трудно доказать, является ли такое поведение истинным проявлением социального интеллекта или же это просто воспроизведение фрагментов обучающей выборки ИИ, где подробно описана история человеческих денег.

💾 Архитектура памяти: почему миллион токенов не заменит воспоминания 31:25

Ключевым элементом реалистичного поведения агентов является их архитектура памяти. Джун Сун Пак и его коллеги разделили память на два уровня:

Поток памяти (memory stream) — долгосрочный модуль, куда записываются абсолютно все события, действия и впечатления, пережитые агентом.
Извлеченная память (scratch memory / retrieve memory) — оперативное короткое пространство, формирующее текущий контекст мышления.

В современных ИИ-разработках ведутся споры о необходимости долгосрочных модулей на фоне стремительного расширения контекстного окна больших моделей. Джун Сун Пак упоминает недавние исследования, где контекст удалось расширить до внушительного одного миллиона токенов. Однако, по мнению исследователя, даже контекстное окно в миллиард токенов не способно вместить весь жизненный опыт реального человека, а концепция «поместить всю жизнь в один промпт» неэффективна по двум причинам.

Во-первых, это колоссальные временные и вычислительные затраты. Человек принимает решения и обрабатывает терабайты информации ежесекундно. По мнению гостя, если бы при падении чашки со стола человеку приходилось заново переосмыслять и перечитывать все свои жизненные выборы, это сделало бы поведение невероятно медленным и дорогостоящим с точки зрения вычислений.

Во-вторых, избыточная информация вредит логике ИИ. Как показывают известные исследования в области методологии Chain of Thought («думай шаг за шагом»), языковые модели склонны отвлекаться на нерелевантные шумы в контексте. Избирательное извлечение только тех фрагментов прошлого, которые критически важны для текущей секунды, делает цепочки рассуждений нейросети чистыми и точными.

🛠️ Текст как универсальный интерфейс и триада релевантности 37:05

Разрабатывая долгосрочную память, инженеры Стэндфорда изначально планировали использовать графы знаний (Knowledge Graphs), связывающие объекты, субъекты и предикаты. Это казалось логичным решением для ассоциативного поиска воспоминаний. Однако на практике выяснилось, что жестко структурированные базы данных нивелируют главное преимущество LLM — их феноменальную способность обрабатывать неструктурированный естественный язык.

В итоге архитектуру упростили: база данных состоит из обычных строчек текста на естественном языке. Все внутренние модули — планирование, память, рефлексия — общаются друг с другом исключительно текстом. Заземление (grounding) в виртуальном мире происходит в самый последний момент: ИИ принимает текстовое решение, и эта команда транслируется игровому движку, который перемещает персонажа, сверяясь с простым древовидным графом сцены (scene graph).

Для перевода воспоминаний из долгосрочной памяти в оперативную была создана специальная функция извлечения, учитывающая три переменные:

Свежесть (recency) — экспоненциальная функция затухания, отдающая приоритет недавним событиям.
Релевантность (relevance) — косинусное сходство векторных эмбеддингов текста воспоминания и текущей ситуации.
Важность (importance) — оценка того, насколько значимым является событие (например, разрыв отношений или выпускной оцениваются высоко, а завтрак двухнедельной давности — минимально).

Показатель важности вычисляется оригинальным способом: система напрямую отправляет языковой модели промпт с вопросом, насколько критично данное событие для персонажа по шкале от 1 до 10. Джун Сун Пак подчеркивает, что их трехфакторная модель — это прежде всего концептуальный фреймворк, который в будущем может быть значительно улучшен за счет интеграции классических наработок профессионального сообщества специалистов по информационному поиску (information retrieval).

⚡ Переход на ChatGPT и будущее генеративных агентов 45:31

Эксперименты начинались на базе классической модели GPT-3. Однако на финальных стадиях разработки научные руководители Джуна Суна Пака — профессора Майкл Бернштейн и Перси Лян — заметили стремительный прогресс технологий и посоветовали срочно перевести проект на API ChatGPT. Это потребовало от команды нескольких бессонных ночей для экстренной перестройки архитектуры, но результат оправдал себя: оптимизированная с помощью RLHF модель гораздо точнее следовала сложным инструкциям промптов.

Подводя итог исследованию, Джун Сун Пак подчеркивает, что генеративные агенты открывают целую эпоху в вычислительной технике. В течение последних десятилетий академическое сообщество практически забросило попытки создания полноценных цифровых симуляций человека, поскольку ручное прописывание сотен тысяч правил было тупиковым и громоздким путем. Появление больших языковых моделей дало исследователям принципиально новый инструмент, позволяющий впервые в истории вплотную приблизиться к созданию по-настоящему правдоподобных автономных агентов.