Див Гарг об агентах: «Будущее — это системы автономных исполнителей»

Stanford Online 6,8 тыс. 1 ч 2 мин 13.05.2025
Главное

Будущее ИИ-агентов: от моделей к автономным исполнителям 0:04

Путь к созданию сильного искусственного интеллекта (AGI) лежит через переосмысление способов проектирования, оценки и развертывания интеллектуальных систем. Див Гарг, основатель и CEO компании AGI Incorporated, на лекции в Стэнфордском университете представил видение ИИ-агентов как цифровых помощников, способных стать более эффективными в цифровой среде, чем сами люди,.

🏗 Архитектура и функциональность агентов 2:16

В основе современного ИИ-агента лежат четыре ключевых компонента, которые в совокупности приближают системы к уровню AGI:

  1. Память: Необходима комбинация кратковременной памяти (например, контекст текущего диалога) и долговременной (история предпочтений пользователя).
  2. Инструментарий: Способность использовать внешние сервисы — калькуляторы, календари, веб-поиск и редакторы кода.
  3. Продвинутое планирование: Включает самокритику, декомпозицию сложных задач на подцели и механизмы «отказоустойчивости» (failover) при возникновении ошибок.
  4. Действия: Возможность самостоятельно совершать действия в цифровом мире от имени пользователя.

По мнению Гарга, важно создавать «человекоподобных» агентов, которые взаимодействуют с интерфейсами через клики и ввод текста, так как это позволяет им работать с 100% ресурсов интернета, а не только с теми 5%, которые предоставляют доступ через API,.

📉 Проблема надежности и доверия 13:56

Главным препятствием для внедрения агентов в повседневную жизнь остается надежность. Согласно данным бенчмарков, таких как realevals.xyz, современные модели, включая GPT-4o и даже более специализированные фреймворки, показывают ограниченную успешность в реальных задачах,.

Гарг полагает, что путь к 99,9% надежности лежит через специализированное обучение с подкреплением (RL). Он продемонстрировал систему Agent Q, которая за счет комбинации поиска по дереву Монте-Карло (MCTS), самокритики и оптимизации прямого предпочтения (DPO) показала рост точности с 20% до 95,4% в задачах бронирования на OpenTable менее чем за день обучения,.

🤝 Коммуникация и многоагентные системы 39:29

Будущее ИИ-систем — это архитектуры, где множество агентов взаимодействуют друг с другом. Разделение задач между специализированными агентами (например, «агент-бухгалтер» и «агент-почтовик») повышает общую эффективность работы.

🔮 Прогнозы и этика 50:38

Вопрос о том, как интернет будет существовать в эпоху агентов (включая их способность решать CAPTCHA), остается «игрой в кошки-мышки». Спикер уверен, что в ближайшие годы человечеству придется перейти на новые методы биометрической идентификации для подтверждения личности пользователя.

На вопрос о том, автоматизируют ли будущие агенты процесс создания самих себя, Гарг ответил утвердительно: он убежден, что в крупных лабораториях это уже происходит. Роль человека в этом процессе, по мнению Гарга, сместится в сторону «менеджмента»: мы будем задавать цели, оценивать промежуточные результаты и корректировать работу целых «отделов» из цифровых агентов.

💬 Цитаты

«Люди станут менеджерами, которые дают фидбек и направление, пока агенты исполняют задачи.»

«Проблема в том, что в реальном мире пользователи дают агенту «один шанс»: если он совершит ошибку, доверие теряется навсегда.»

слушатель 54:38
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Сильный искусственный интеллект, способный выполнить любую интеллектуальную задачу, доступную человеку.
RL (Reinforcement Learning)
Обучение с подкреплением, где модель учится принимать верные решения через систему наград и штрафов.
MCP (Model Context Protocol)
Стандарт коммуникации, позволяющий ИИ-моделям безопасно и унифицировано взаимодействовать с различными API.
MCTS (Monte Carlo Tree Search)
Алгоритм поиска по дереву, используемый для принятия решений в сложных пространствах состояний.
DPO (Direct Preference Optimization)
Метод дообучения LLM с использованием данных о предпочтениях пользователя (успех/провал).
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Div Garg AGI Incorporated Agent Q Model Context Protocol Multi-agent systems