# Эра ИИ-агентов: как Google планирует автоматизировать работу целых отделов

Источник: https://www.youtube.com/watch?v=-fW0v2aHoeQ
Канал: Wes Roth
Опубликовано: 10.04.2024

---

В рамках ежегодной конференции Google Cloud Next компания Google представила масштабное обновление своей экосистемы, сделав основной акцент на внедрении специализированных ИИ-агентов. Эти инструменты призваны трансформировать привычные рабочие процессы — от обслуживания клиентов и маркетинга до написания программного кода и обеспечения кибербезопасности.

## 🤖 Новая эра ИИ-агентов: концепция и база
[[JUMP:00:00]]

Главной темой презентации Google Cloud Next стало превращение генеративного ИИ из простого чат-бота в полноценных «агентов» [00:14]. В отличие от базовых моделей, агенты способны одновременно обрабатывать мультимодальную информацию, рассуждать, обучаться и принимать самостоятельные решения в рамках заданных бизнес-процессов [01:07].

По словам спикеров Google, ИИ-агенты изменят то, как люди взаимодействуют с вычислительными устройствами и интернетом. Фундаментом для этого выступает модель Gemini 1.5 Pro, которая обладает уникальным для индустрии контекстным окном в 1 миллион токенов [01:58]. 

Автор канала Wes Roth отмечает несколько ключевых технологических факторов:

*   Google адаптировала архитектуру «смеси экспертов» (Mixture of Experts), аналогичную той, что используется в GPT-4 [02:27].
*   Компания стремится вернуть себе лидерство в технологиях, которые она сама когда-то изобрела (трансформеры), но которые быстрее внедрила OpenAI [02:40].
*   Огромное контекстное окно Gemini 1.5 Pro позволяет модели анализировать гигантские объемы данных за один запрос, что критично для корпоративного сектора [03:22].

## 🛍️ Агенты для работы с клиентами
[[JUMP:04:00]]

Google представила Vertex AI Agent Builder — инструмент, позволяющий компаниям создавать мощных агентов поддержки в три этапа [04:13]. Эти агенты поддерживают свободное общение с использованием текста, голоса и видео, а также могут быть персонализированы с помощью кастомных голосовых моделей [04:40].

В ходе демонстрации на примере магазина «Symbol Fashion» было показано, как ИИ-агент помогает пользователю найти вещь по видеофрагменту [06:11].

*   **Мультимодальность:** пользователь загрузил видео с концерта, и агент распознал рубашку на клавишнике [06:25].
*   **Бесшовный переход:** когда пользователь позвонил в магазин, голосовой агент уже знал историю чата и предложил применить бонусный ваучер на 20% [07:33].
*   **Допродажи:** ИИ автоматически подобрал к покупке ботинки и белую рубашку, соответствующие стилю [07:46].

Wes Roth выражает опасение, что компании могут злоупотреблять этой технологией для агрессивного маркетинга, внедряя «жесткие продажи» прямо в процессе консультации [08:39].

## 👔 Агенты-сотрудники: автоматизация рутины
[[JUMP:09:07]]

Для внутреннего использования в компаниях Google предлагает «агентов-сотрудников», интегрированных в Google Workspace. Основная цель — избавить людей от необходимости вручную изучать сотни страниц документов [11:09]. 

Ключевые возможности, показанные на презентации:

1.  **Сравнение документов:** Gemini в боковой панели Google Docs может сравнить два 70-страничных предложения от вендоров по цене за несколько секунд [10:29].
2.  **Проверка комплаенса:** Агент способен сопоставить проект контракта с внутренним 100-страничным сводом правил компании и выявить нарушения (например, отсутствие сертификатов безопасности) [11:48].
3.  **Здравоохранение:** Система Katy в HCA Healthcare помогает медсестрам передавать смену, суммируя данные о пациентах разговорным языком, чтобы сократить время на бумажную работу [12:30].

Особо впечатляющим примером стала автоматизация анализа корпоративных льгот [13:10]. Агент смог проанализировать 14-страничное письмо и часовое видеопрезентацию о медицинской страховке, после чего нашел в сети стоматолога, входящего в страховую сеть и работающего по субботам, и назначил встречу, сверившись с календарем сотрудника [16:34].

## 🎬 Google Vids и креативные инструменты
[[JUMP:17:25]]

Google анонсировала новое приложение в составе Workspace — Google Vids [17:51]. Это ИИ-помощник для создания видеопрезентаций, который берет на себя роль сценариста, редактора и продюсера.

*   Пользователь вводит промпт или ссылается на документ, а Gemini предлагает структуру сюжета [18:30].
*   Приложение автоматически подбирает стоковые видео, музыку и генерирует закадровый голос [18:55].

Для отделов маркетинга представлены обновления в Imagine 2.0. Теперь доступна генерация «живых изображений» (Text-to-Live Image) — коротких анимированных фрагментов (распускающийся цветок, кипящее на плите блюдо) [20:29]. Также внедрена технология цифровых водяных знаков Synth ID от Google DeepMind для маркировки ИИ-контента [20:54].

Креативный агент может анализировать всю историю бренда (тысячи изображений и документов в Drive), чтобы создавать новые кампании, соответствующие уникальному стилю [21:47]. В одном из демо ИИ мгновенно превратил рекламный сюжет для опытных туристов в контент для «расслабленного кемпинга», изменив как визуал, так и тональность текста [23:16].

## 💻 Gemini Code Assist: прорыв в разработке
[[JUMP:25:51]]

Новый инструмент Gemini Code Assist (ранее Duet AI) нацелен на радикальное повышение производительности программистов. Wes Roth цитирует данные Goldman Sachs, согласно которым помощники могут повысить эффективность кодинга на 40% [25:00].

Благодаря контекстному окну в 1 млн токенов, Code Assist понимает всю кодовую базу целиком, а не отдельные фрагменты [27:11].

*   Модель может обрабатывать до 100 000 строк кода, в то время как конкуренты часто ограничены 12–15 тысячами [27:23].
*   В примере новый разработчик с помощью ИИ смог за минуты перенести функцию рекомендаций на главную страницу сайта, опираясь на визуальный макет из Figma и учитывая все зависимости в микросервисах [26:44].
*   По оценке Google, ручной анализ такого объема файлов занял бы у человека 70 часов непрерывного чтения [29:13].

## 📊 Агенты по работе с данными и безопасностью
[[JUMP:31:21]]

Data Agents позволяют вести диалог с корпоративными данными на естественном языке, используя BigQuery и Looker для прогнозирования [32:30]. Например, агент в ритейле может выявить разрыв между спросом и предложением на 3 месяца вперед и предложить альтернативные товары для закупки [33:10].

Важным направлением стали Security Agents. В условиях растущего числа кибератак ИИ-агенты будут работать в режиме 24/7, занимаясь предотвращением, обнаружением и реагированием на угрозы [35:20]. Google объединяет здесь свой опыт с данными компании Mandiant (специалисты по реагированию на инциденты), чтобы выявлять возникающие риски на ранних стадиях [35:34].

Wes Roth подчеркивает, что развитие ИИ создает новые векторы атак — злоумышленники могут использовать нейросети для поиска скрытых связей в разрозненных данных, поэтому внедрение защитных ИИ-агентов станет критически важным в ближайшее десятилетие [34:53].