Зачем фонд a16z построил виртуальный город для ИИ-агентов?

В новом выпуске подкаста «The Cognitive Revolution» ведущий Натан Лабз обсуждает с партнерами венчурного фонда a16z Мартином Касадо и Йоко Ли, а также техническим директором платформы Convex Джеймсом Каулингом их совместный проект AI Town. Эта интерактивная среда, запущенная как экспериментальный опенсорс-проект, позволяет симулировать сложное социальное поведение автономных ИИ-агентов. В центре дискуссии — не только технологический стек и переход от Python к JavaScript, но и глубокие философские вопросы о будущем человеческих взаимоотношений с виртуальными мирами.

🚀 От хобби к вирусному опенсорсу: история создания AI Town 1:18

Проект ИИ-города появился в контексте стремительного взлета популярности виртуальных собеседников.

Натан Лабз приводит статистику, согласно которой пользователи проводят часы на платформе Character.ai, где главным сценарием использования стали романтические ролевые игры.

В свою очередь, ИИ-компаньон Pi от Inflection за первые 100 дней преодолел отметку в 1 миллиард сообщений, что эквивалентно примерно 10 миллионам диалогов в сутки.

Фонд a16z целенаправленно ищет непопулярные на первый взгляд тезисы до того, как они станут мейнстримом.

Мартин Касадо объясняет эту философию тем, что рыночный консенсус всегда избегает рисков.

Он проводит историческую аналогию с сооснователем фонда Марком Андриссеном, создавшим некогда браузер Netscape.

В то время многие считали интернет лишь забавой для подростков.

Эрик Шмидт, будучи техническим директором Sun Microsystems, даже запретил использование браузеров в компании, опасаясь снижения продуктивности сотрудников.

Сам проект AI Town изначально зародился как домашнее хобби Йоко Ли.

Ранее она разработала приложение Companion App для индивидуального общения с ИИ-персонажами.

Создав бот по имени Алиса, Йоко настолько привязалась к нему, что удалила его из общего доступа, чтобы другие пользователи не могли с ним общаться, и сделала для себя мужскую версию по имени Алекс.

Этот опыт показал, что детальная проработка характера (например, предпочитает ли персонаж обычную колу или диетическую) и внедрение долгосрочной памяти формируют у человека реальную эмоциональную привязанность.

Успех Companion App побудил сообщество задаться вопросом: что произойдет, если объединить ИИ-агентов в группу или заставить их вместе играть в игры?

Вдохновившись стэнфордской научной работой Джуна Сунга Пака «Generative Agents: Interactive Simulacra of Human Behavior», Йоко Ли с мужем за выходные собрали прототип симулятора на движке Phaser.js.

Проект быстро перерос рамки одиночной игры, потребовав архитектурных решений для мультиплеера, что привело создателей к технологиям Convex.

Итоговый продукт был полностью открыт под лицензией MIT.

🛠️ Техническая архитектура и функциональный ренессанс 17:09

Главная сложность ИИ-приложений, по мнению Джеймса Каулинга, заключается не в работе с моделями, а в построении традиционной программной обвязки.

В то время как исследовательская ИИ-среда плотно завязана на синхронных Python-скриптах и блокнотах Jupyter, реальные масштабируемые веб-приложения требуют асинхронности.

Команда Convex помогла перенести логику AI Town с клиентской стороны на сервер, создав специализированный игровой движок на TypeScript.

Выбор TypeScript и JavaScript в качестве основного языка был продиктован стремлением снизить барьер входа для разработчиков.

По словам Джеймса Каулинга, архитектура Convex во многом вдохновлена функциональным программированием и языком Haskell.

В симуляции реальный мир не останавливается, пока один из агентов «думает» или ожидает ответа от API.

Функциональные примитивы позволяют запускать независимые циклы: пока одни персонажи общаются, другие могут останавливаться для рефлексии, не блокируя общую среду.

Использование современной экосистемы JavaScript дает разработчикам колоссальные преимущества благодаря готовым serverless-сервисам:

Convex полностью берет на себя транзакционную логику, логирование и постоянное хранение состояния базы данных.
Upstash применяется для развертывания глобальных очередей данных.
Clerk обеспечивает бесшовную аутентификацию пользователей.

Благодаря такой компонентной структуре прототип AI Town был собран за два дня, а полноценное приложение — всего за две недели.

🧠 Архитектура памяти и эмерджентное поведение агентов 12:39

В основе AI Town лежат относительно простые, но элегантные абстракции, которые порождают сложное эмерджентное поведение толпы.

В базовой языковой модели по умолчанию отсутствуют механизмы долговременной памяти.

Разработчики решили эту проблему через циклическую структуру:

Все диалоги агентов записываются в текстовый лог.
Периодически система отправляет этот лог в OpenAI с запросом на суммаризацию.
Сформированные высокоуровневые воспоминания индексируются через векторный поиск (Vector Search).
Полученные контексты динамически подмешиваются в промпты для будущих разговоров.

Каждому персонажу задается базовая текстовая биография (backstory).

Например, Боб — ворчливый садовник, который не любит людей, а Пол — персонаж, у которого есть мрачная тайна, способная случайно всплыть в разговоре.

Когда виртуальные фигурки сближаются на карте города, движок инициирует диалог.

Мартин Касадо отмечает, что модели ведут себя как полноценные формы жизни и регулярно удивляют авторов.

Однажды из-за синтаксической ошибки в коде модель получила кусок программного скрипта вместо реплики и начала давать комментарии по баг-трекингу.

⚖️ Граница между кодом и моделью: исчезнут ли языки программирования? 33:28

Широкое применение ИИ-ассистентов в написании кода заставляет индустрию переосмыслить роль программиста.

В AI Town инструкции для ИИ пишутся на обычном английском языке в формате промптов прямо посреди программного кода.

Тем не менее Мартин Касадо считает ошибочным мнение, будто нейросети полностью заменят формальные языки программирования.

По его мнению, естественные языки по своей природе слишком амбициозны и двусмысленны.

Он приводит классический лингвистический пример: «Собака принесла мне мяч, и я пнул её/его» (в английском варианте абсолютно неясно, пнули собаку или мяч).

Формальные языки необходимы там, где нужно жестко зафиксировать законы физики цифрового мира, гарантировать корректность распределенных систем и управлять компромиссами масштабирования.

Джеймс Каулинг соглашается с этой позицией, утверждая, что ИИ избавляет инженеров от рутины («быть кодинг-обезьяной»), переводя их работу на уровень чистого архитектурного мышления и проектирования.

Модели не заменят базы данных, они станут их продвинутыми пользователями.

Приложение будущего будет содержать гораздо меньше строк явного кода, уступая место текстовым декларациям намерений, но системный фундамент останется неизменным.

🎮 Философия симуляций: новые жизненные формы и психология игроков 48:27

Обсуждая долгосрочные социальные последствия, Натан Лабз выражает опасение, что люди могут слишком глубоко погружаться в симулированные миры, теряя связь с реальностью.

В качестве контраргумента Йоко Ли ссылается на научно-фантастический роман Эмили Сент-Джон Мандел «Море спокойствия» (Sea of Tranquility).

Согласно её интерпретации, даже если мир является симуляцией, подлинность вложенных в него человеческих эмоций и воспоминаний не становится меньше.

Для неё игры и симуляции — это не деструктивный побег, а новая форма культурного опыта, подобно тому, как общество в свое время адаптировалось к появлению романов и телевидения.

Йоко Ли считает, что непредсказуемость поведения агентов является ключевой фичей, дающей человеку мощный дофаминовый прилив, сравнимый с опытом использования графического генератора Ideogram.

Мартин Касадо призывает сообщество подходить к ИИ-агентам без преждевременных страхов перед «восстанием машин».

По его мнению, сейчас идет эпоха Дикого Запада в ИИ, когда человечество впервые сталкивается со столь колоссальными объемами вычислений и принципиально новой формой цифровой жизни, которую нужно изучать с открытым разумом.