Див Гарг об агентах: «Будущее — это системы автономных исполнителей»

Будущее ИИ-агентов: от моделей к автономным исполнителям 0:04

Путь к созданию сильного искусственного интеллекта (AGI) лежит через переосмысление способов проектирования, оценки и развертывания интеллектуальных систем. Див Гарг, основатель и CEO компании AGI Incorporated, на лекции в Стэнфордском университете представил видение ИИ-агентов как цифровых помощников, способных стать более эффективными в цифровой среде, чем сами люди,.

🏗 Архитектура и функциональность агентов 2:16

В основе современного ИИ-агента лежат четыре ключевых компонента, которые в совокупности приближают системы к уровню AGI:

Память: Необходима комбинация кратковременной памяти (например, контекст текущего диалога) и долговременной (история предпочтений пользователя).
Инструментарий: Способность использовать внешние сервисы — калькуляторы, календари, веб-поиск и редакторы кода.
Продвинутое планирование: Включает самокритику, декомпозицию сложных задач на подцели и механизмы «отказоустойчивости» (failover) при возникновении ошибок.
Действия: Возможность самостоятельно совершать действия в цифровом мире от имени пользователя.

По мнению Гарга, важно создавать «человекоподобных» агентов, которые взаимодействуют с интерфейсами через клики и ввод текста, так как это позволяет им работать с 100% ресурсов интернета, а не только с теми 5%, которые предоставляют доступ через API,.

📉 Проблема надежности и доверия 13:56

Главным препятствием для внедрения агентов в повседневную жизнь остается надежность. Согласно данным бенчмарков, таких как realevals.xyz, современные модели, включая GPT-4o и даже более специализированные фреймворки, показывают ограниченную успешность в реальных задачах,.

Лучшие модели, такие как Claude 3.7, достигают лишь около 40–41% точности в задачах автоматизации интерфейсов.
Ошибки в таких системах могут приводить к лишним затратам вычислительных мощностей или к критическим сбоям, как отметил один из слушателей, чей агент случайно удалил 3000 строк кода,.

Гарг полагает, что путь к 99,9% надежности лежит через специализированное обучение с подкреплением (RL). Он продемонстрировал систему Agent Q, которая за счет комбинации поиска по дереву Монте-Карло (MCTS), самокритики и оптимизации прямого предпочтения (DPO) показала рост точности с 20% до 95,4% в задачах бронирования на OpenTable менее чем за день обучения,.

🤝 Коммуникация и многоагентные системы 39:29

Будущее ИИ-систем — это архитектуры, где множество агентов взаимодействуют друг с другом. Разделение задач между специализированными агентами (например, «агент-бухгалтер» и «агент-почтовик») повышает общую эффективность работы.

Однако, как подчеркивает Гарг, коммуникация между агентами неизбежно является «потерями» (lossy): чем больше агентов в системе, тем выше квадратичная вероятность ошибки при передаче информации.
Для решения этой проблемы внедряются протоколы вроде MCP (Model Context Protocol) от Anthropic, которые стандартизируют способы взаимодействия между API и ИИ-моделями,.

🔮 Прогнозы и этика 50:38

Вопрос о том, как интернет будет существовать в эпоху агентов (включая их способность решать CAPTCHA), остается «игрой в кошки-мышки». Спикер уверен, что в ближайшие годы человечеству придется перейти на новые методы биометрической идентификации для подтверждения личности пользователя.

На вопрос о том, автоматизируют ли будущие агенты процесс создания самих себя, Гарг ответил утвердительно: он убежден, что в крупных лабораториях это уже происходит. Роль человека в этом процессе, по мнению Гарга, сместится в сторону «менеджмента»: мы будем задавать цели, оценивать промежуточные результаты и корректировать работу целых «отделов» из цифровых агентов.