# Див Гарг об агентах: «Будущее — это системы автономных исполнителей»

Источник: https://www.youtube.com/watch?v=nEHNwdrbfGA
Канал: Stanford Online
Опубликовано: 13.05.2025

---

## Будущее ИИ-агентов: от моделей к автономным исполнителям

[[JUMP:0:04]]

Путь к созданию сильного искусственного интеллекта (AGI) лежит через переосмысление способов проектирования, оценки и развертывания интеллектуальных систем. Див Гарг, основатель и CEO компании AGI Incorporated, на лекции в Стэнфордском университете представил видение ИИ-агентов как цифровых помощников, способных стать более эффективными в цифровой среде, чем сами люди,.

### 🏗 Архитектура и функциональность агентов
[[JUMP:2:16]]

В основе современного ИИ-агента лежат четыре ключевых компонента, которые в совокупности приближают системы к уровню AGI:

1.  **Память:** Необходима комбинация кратковременной памяти (например, контекст текущего диалога) и долговременной (история предпочтений пользователя).
2.  **Инструментарий:** Способность использовать внешние сервисы — калькуляторы, календари, веб-поиск и редакторы кода.
3.  **Продвинутое планирование:** Включает самокритику, декомпозицию сложных задач на подцели и механизмы «отказоустойчивости» (failover) при возникновении ошибок.
4.  **Действия:** Возможность самостоятельно совершать действия в цифровом мире от имени пользователя.

По мнению Гарга, важно создавать «человекоподобных» агентов, которые взаимодействуют с интерфейсами через клики и ввод текста, так как это позволяет им работать с 100% ресурсов интернета, а не только с теми 5%, которые предоставляют доступ через API,.

### 📉 Проблема надежности и доверия
[[JUMP:13:56]]

Главным препятствием для внедрения агентов в повседневную жизнь остается надежность. Согласно данным бенчмарков, таких как `realevals.xyz`, современные модели, включая GPT-4o и даже более специализированные фреймворки, показывают ограниченную успешность в реальных задачах,.

*   Лучшие модели, такие как Claude 3.7, достигают лишь около 40–41% точности в задачах автоматизации интерфейсов.
*   Ошибки в таких системах могут приводить к лишним затратам вычислительных мощностей или к критическим сбоям, как отметил один из слушателей, чей агент случайно удалил 3000 строк кода,.

Гарг полагает, что путь к 99,9% надежности лежит через специализированное обучение с подкреплением (RL). Он продемонстрировал систему **Agent Q**, которая за счет комбинации поиска по дереву Монте-Карло (MCTS), самокритики и оптимизации прямого предпочтения (DPO) показала рост точности с 20% до 95,4% в задачах бронирования на OpenTable менее чем за день обучения,.

### 🤝 Коммуникация и многоагентные системы
[[JUMP:39:29]]

Будущее ИИ-систем — это архитектуры, где множество агентов взаимодействуют друг с другом. Разделение задач между специализированными агентами (например, «агент-бухгалтер» и «агент-почтовик») повышает общую эффективность работы.

*   Однако, как подчеркивает Гарг, коммуникация между агентами неизбежно является «потерями» (lossy): чем больше агентов в системе, тем выше квадратичная вероятность ошибки при передаче информации.
*   Для решения этой проблемы внедряются протоколы вроде MCP (Model Context Protocol) от Anthropic, которые стандартизируют способы взаимодействия между API и ИИ-моделями,.

### 🔮 Прогнозы и этика
[[JUMP:50:38]]

Вопрос о том, как интернет будет существовать в эпоху агентов (включая их способность решать CAPTCHA), остается «игрой в кошки-мышки». Спикер уверен, что в ближайшие годы человечеству придется перейти на новые методы биометрической идентификации для подтверждения личности пользователя.

На вопрос о том, автоматизируют ли будущие агенты процесс создания самих себя, Гарг ответил утвердительно: он убежден, что в крупных лабораториях это уже происходит. Роль человека в этом процессе, по мнению Гарга, сместится в сторону «менеджмента»: мы будем задавать цели, оценивать промежуточные результаты и корректировать работу целых «отделов» из цифровых агентов.