Эпоха агентов: как ИИ-системы перестают быть просто чат-ботами и начинают действовать

Яндекс 4,4 тыс. 1 ч 24 мин 5 мин 30.04.2026
Главное

В новом выпуске «yet another podcast» ведущий и эксперты из Яндекса обсуждают, как концепция ИИ-агентов меняет привычный ландшафт технологий. В центре внимания — переход от простых чат-ботов к автономным системам, способным управлять браузером, писать код без багов и даже бронировать столики в ресторанах, сталкиваясь с реальными проблемами физического мира.

🤖 От чат-ботов к агентам: в чем разница? 5:57

Обсуждение начинается с попытки разграничить понятия «ассистент» и «агент». По словам Ильи Никонорова, ассистент — это широкая метакатегория (как «автомобиль»), в то время как агент — это конкретная эволюция интерфейса .

Павел Капля и Артур Смигулин выделяют два типа систем:

Ключевое отличие агента от старых алгоритмов умного дома заключается в способности обрабатывать неопределенность. Если раньше отсутствие комнаты «подсобка» приводило к ошибке, то современный агент на базе LLM может предположить, что пользователь имеет в виду «кладовку», или уточнить информацию в диалоге .

💼 ИИ на службе бизнеса: кейсы Яндекс Cloud 18:24

Артур Смигулин, отвечающий за платформу Yandex Cloud ML Studio, делится статистикой использования агентов в бизнесе. На платформе создано уже несколько тысяч агентов .

Основные сферы применения:

  1. Техподдержка (20%) — ответы на вопросы пользователей с доступом к внутренним базам знаний и CRM-системам .
  2. Работа со знаниями (10%) — быстрый поиск информации внутри корпоративных документов .
  3. Юридический домен (Legal) — стартапы и крупные компании загружают юридические документы для автоматизации анализа контрактов .
  4. Продажи (квалификация лидов) — агенты самостоятельно изучают информацию о компании-заказчике в интернете и CRM, подготавливая краткое досье для менеджера .

Артур отмечает, что хотя 30% агентов в Studio собираются с помощью low-code инструментов (визуальное программирование), 70% все еще требуют написания кода для интеграции со сложными системами . По его мнению, работа офисного сотрудника фундаментально меняется: люди начинают делать «больше и другой работы», до которой раньше не могли дотянуться из-за нехватки времени или ресурсов .

💻 Программирование и кодовые агенты 25:56

Эксперты сходятся во мнении, что самый качественный скачок произошел в сфере написания кода. Илья Никоноров отмечает, что появление моделей Anthropic (Claude 3.5 Sonnet) изменило правила игры: ИИ начал писать код практически без багов .

Важные аспекты работы кодовых агентов:

Павел Капля вспоминает, как первые прототипы агентских функций в Алисе (запуск будильника через LLM) срабатывали за 12 секунд . Сегодня же технологии оптимизированы настолько, что агентские архитектуры становятся нормой для умных устройств, хотя это по-прежнему дорого с точки зрения вычислительных мощностей .

🌐 Агенты в браузере: «Гуманоиды цифрового мира» 31:35

Илья Никоноров обсуждает концепцию браузерных агентов, которые Андрей Карпаты метко назвал «роботами-гуманоидами для цифрового мира» . В отличие от чат-бота, браузерный агент работает в привычном интерфейсе сайтов, заменяя человека в рутинных действиях: фильтрации товаров на маркетплейсе, прокликивании форм заказа или бронировании услуг .

Трудности на пути браузерных агентов:

Примером успешного внедрения является агент бронирования в Яндексе, который может «ногами» (через браузерный интерфейс) записать пользователя в салон красоты или ресторан, если у заведения нет открытого API для интеграции с Картами .

🎪 Курьезы и «Пьяный мастер» 51:14

Разработка агентов полна смешных случаев, вызванных тем, что ИИ начинает действовать автономно.

🚨 Безопасность и OpenManus (OpenClow) 56:03

Особое внимание уделили проекту OpenClow (изначально CloudBot), который представляет собой радикальный инженерный эксперимент. Это «первая версия персонального агента», который живет на отдельном сервере, имеет доступ к компьютеру и может сам себе писать инструменты (коннекторы) .

Однако такая автономность несет риски. Тред в социальной сети может содержать «промпт-инъекцию»: вредоносный код, замаскированный под текст. Агент, читая такой тред, может получить команду переслать ключи авторизации пользователя на сторонний адрес, не сообщив об этом владельцу .

🎓 Образование и будущее интерфейсов 1:11:00

Образование стало одним из главных локомотивов внедрения ИИ. Павел Капля отмечает, что школьники и студенты — самая подвижная аудитория: они мгновенно переходят на тот продукт, который лучше решает задачи (например, Perplexity или Алиса) . При этом Яндекс видит свою миссию не в создании «шпаргалок» (ГДЗ), а в развитии образовательного уклона, который помогает понять материал .

В финале эксперты обсудили, почему голосовой интерфейс умнеет медленнее чатового. Причины технические: голосовой ответ должен быть мгновенным, что ограничивает размер используемых моделей (большие матрицы дольше перемножаются) . Кроме того, в устройствах первична предсказуемость, тогда как LLM по своей природе стохастичны . Тем не менее, каждый из участников уже использует ИИ в личной жизни: Артур Смигулин «общается» с Chat GPT за рулем, обсуждая рабочие вопросы и новости, пока едет домой .

💬 Цитаты

«Агент — это гуманоид, но только для цифрового мира.»

Илья Никоноров 33:19

«Я с матерным словом обратился к модельке, и моделька в ответ ко мне обратилась с матерным словом.»

Артур Смигулин 1:03:51

«Чётко знать, что ты хочешь — это важнейший навык при работе с машинами.»

👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Workflow
Строго заданная последовательность действий программы, где каждый шаг предопределен разработчиком.
Function Calling
Способность языковой модели вызывать внешние программные функции или API для выполнения задач в реальном мире.
Промпт-инъекция
Тип атаки на ИИ, при которой во входных данных скрыта инструкция, заставляющая модель нарушить правила безопасности.
Компактизация
Процесс сжатия длинной истории диалога или кода для того, чтобы важная информация уместилась в ограниченную «память» (контекстное окно) модели.
📊 Цифры
🗓 Хронология
  1. 2022 Массовая техноистерия с появлением ChatGPT.
  2. Март 2023 Первые эксперименты с фреймворком BabyAGI («пьяный мастер»).
  3. Конец 2024 Качественный скачок моделей Anthropic в написании кода.
  4. 2025 Прогноз участников как «года расцвета агентов».
⚖️ Другая сторона
Искусственный интеллект Яндекс LLM ИИ-агенты ChatGPT Claude