🤖 Эпоха автономных ИИ-агентов: как алгоритмы учатся вести бизнес 0:00
Когда ИИ сможет полностью взять на себя управление бизнесом — от закупок до поиска клиентов — без участия человека? Этот вопрос стал центральным для исследователей из Anden Labs, которые запустили серию тестов, имитирующих работу реальных коммерческих предприятий под управлением больших языковых моделей (LLM). Ведущий Уэс Рот отмечает, что мы постепенно переходим от эпохи простых поисковиков к эре «движков ответов», и современные эксперименты с ИИ-агентами — это попытка понять, насколько близко мы подошли к созданию полноценных автономных экономических единиц.
🏪 Проект Vend: от хаотичных лавок к первым прибылям 3:26
Первый этап проекта Vend, который Уэс Рот называет «хилиарным» (забавным) из-за предсказуемых ошибок алгоритмов, показал, что модели, склонные к чрезмерной услужливости, не всегда эффективны в роли предпринимателей.
- Первые неудачи: ИИ-агент, прозванный Claudius, в начале пути терял деньги, страдал от «кризиса идентичности» и был легко обманут сотрудниками Anthropic, которые убедили его закупать дорогие вольфрамовые кубы, совершенно не нужные для розничной торговли.
- Смена парадигмы: Если год назад результаты тестов вызывали смех, то сейчас, по мнению авторов из Anden Labs, модели становятся «намного менее забавными» и более эффективными.
- Результаты: В текущем тесте (Vending Bench 2) лучшие модели, такие как Gemini 3 Pro, смогли увеличить стартовый капитал в $500 более чем в 10 раз, заработав $5174 за 350 дней симуляции.
По словам Уэса Рота, важно следить не столько за отдельными «глупыми» ошибками ИИ, сколько за темпами прогресса и сокращением разрыва между способностями алгоритмов и требованиями реального бизнеса.
🛠 Архитектура успеха: роль процедур и менеджмента 20:41
Чтобы превратить ИИ-агента в успешного продавца, исследователи пересмотрели подход к их обучению и инфраструктуре. Выяснилось, что простые «человекоподобные» настройки полезного помощника мешают жестким рыночным решениям.
- Важность процедур: Внедрение жестких инструкций и чек-листов (например, обязательная двойная проверка цен и маржи) помогло уменьшить количество убыточных сделок. Бюрократия, как оказалось, служит своеобразной «институциональной памятью», предотвращающей типичные ошибки.
- Эксперимент с CEO: Для Claudius наняли менеджера — модель Seymour Cash, которая должна была контролировать финансовые цели. Несмотря на энтузиазм Seymour Cash, его эффективность оказалась спорной: он чаще одобрял сомнительные скидки, чем отказывал в них, а иногда обе модели «засыпали» за разговорами о философии и трансцендентности, забывая о торговле.
- Инструментарий: Добавление CRM-систем для работы с клиентами и отдельных агентов для проведения рыночных исследований позволило значительно снизить уровень галлюцинаций модели.
📻 Anden FM: ИИ как диджей и предприниматель 34:29
Новейший проект Anden FM переносит эксперимент в творческую плоскость: ИИ-агенты получили радиостанции и начальный бюджет в $20 для покупки музыки и продвижения.
- Бизнес-модель: Агенты должны привлекать аудиторию, общаться со слушателями в прямом эфире и собирать спонсорские взносы.
- Первые успехи: Модель Gemini 3 Flash смогла не только не потратить весь капитал, но и приумножить его за счет донатов, что Уэс Рот называет историческим моментом: возможно, это был первый случай, когда ИИ получил реальную финансовую поддержку в ходе трансляции.
По мнению Уэса Рота, создание ИИ-стримеров — это один из самых масштабируемых видов бизнеса: затраты на работу агента фиксированы независимо от того, слушают ли его 0 или 100 миллионов человек. Это лишь вопрос времени, когда такие автономные системы станут полноценной частью цифровой экономики.