Эра ИИ-агентов: как Google планирует автоматизировать работу целых отделов

Wes Roth 137 тыс. 36 мин 4 мин 10.04.2024
Главное

В рамках ежегодной конференции Google Cloud Next компания Google представила масштабное обновление своей экосистемы, сделав основной акцент на внедрении специализированных ИИ-агентов. Эти инструменты призваны трансформировать привычные рабочие процессы — от обслуживания клиентов и маркетинга до написания программного кода и обеспечения кибербезопасности.

🤖 Новая эра ИИ-агентов: концепция и база 0:00

Главной темой презентации Google Cloud Next стало превращение генеративного ИИ из простого чат-бота в полноценных «агентов» . В отличие от базовых моделей, агенты способны одновременно обрабатывать мультимодальную информацию, рассуждать, обучаться и принимать самостоятельные решения в рамках заданных бизнес-процессов .

По словам спикеров Google, ИИ-агенты изменят то, как люди взаимодействуют с вычислительными устройствами и интернетом. Фундаментом для этого выступает модель Gemini 1.5 Pro, которая обладает уникальным для индустрии контекстным окном в 1 миллион токенов .

Автор канала Wes Roth отмечает несколько ключевых технологических факторов:

🛍️ Агенты для работы с клиентами 4:00

Google представила Vertex AI Agent Builder — инструмент, позволяющий компаниям создавать мощных агентов поддержки в три этапа . Эти агенты поддерживают свободное общение с использованием текста, голоса и видео, а также могут быть персонализированы с помощью кастомных голосовых моделей .

В ходе демонстрации на примере магазина «Symbol Fashion» было показано, как ИИ-агент помогает пользователю найти вещь по видеофрагменту .

Wes Roth выражает опасение, что компании могут злоупотреблять этой технологией для агрессивного маркетинга, внедряя «жесткие продажи» прямо в процессе консультации .

👔 Агенты-сотрудники: автоматизация рутины 9:07

Для внутреннего использования в компаниях Google предлагает «агентов-сотрудников», интегрированных в Google Workspace. Основная цель — избавить людей от необходимости вручную изучать сотни страниц документов .

Ключевые возможности, показанные на презентации:

  1. Сравнение документов: Gemini в боковой панели Google Docs может сравнить два 70-страничных предложения от вендоров по цене за несколько секунд .
  2. Проверка комплаенса: Агент способен сопоставить проект контракта с внутренним 100-страничным сводом правил компании и выявить нарушения (например, отсутствие сертификатов безопасности) .
  3. Здравоохранение: Система Katy в HCA Healthcare помогает медсестрам передавать смену, суммируя данные о пациентах разговорным языком, чтобы сократить время на бумажную работу .

Особо впечатляющим примером стала автоматизация анализа корпоративных льгот . Агент смог проанализировать 14-страничное письмо и часовое видеопрезентацию о медицинской страховке, после чего нашел в сети стоматолога, входящего в страховую сеть и работающего по субботам, и назначил встречу, сверившись с календарем сотрудника .

🎬 Google Vids и креативные инструменты 17:25

Google анонсировала новое приложение в составе Workspace — Google Vids . Это ИИ-помощник для создания видеопрезентаций, который берет на себя роль сценариста, редактора и продюсера.

Для отделов маркетинга представлены обновления в Imagine 2.0. Теперь доступна генерация «живых изображений» (Text-to-Live Image) — коротких анимированных фрагментов (распускающийся цветок, кипящее на плите блюдо) . Также внедрена технология цифровых водяных знаков Synth ID от Google DeepMind для маркировки ИИ-контента .

Креативный агент может анализировать всю историю бренда (тысячи изображений и документов в Drive), чтобы создавать новые кампании, соответствующие уникальному стилю . В одном из демо ИИ мгновенно превратил рекламный сюжет для опытных туристов в контент для «расслабленного кемпинга», изменив как визуал, так и тональность текста .

💻 Gemini Code Assist: прорыв в разработке 25:51

Новый инструмент Gemini Code Assist (ранее Duet AI) нацелен на радикальное повышение производительности программистов. Wes Roth цитирует данные Goldman Sachs, согласно которым помощники могут повысить эффективность кодинга на 40% .

Благодаря контекстному окну в 1 млн токенов, Code Assist понимает всю кодовую базу целиком, а не отдельные фрагменты .

📊 Агенты по работе с данными и безопасностью 31:21

Data Agents позволяют вести диалог с корпоративными данными на естественном языке, используя BigQuery и Looker для прогнозирования . Например, агент в ритейле может выявить разрыв между спросом и предложением на 3 месяца вперед и предложить альтернативные товары для закупки .

Важным направлением стали Security Agents. В условиях растущего числа кибератак ИИ-агенты будут работать в режиме 24/7, занимаясь предотвращением, обнаружением и реагированием на угрозы . Google объединяет здесь свой опыт с данными компании Mandiant (специалисты по реагированию на инциденты), чтобы выявлять возникающие риски на ранних стадиях .

Wes Roth подчеркивает, что развитие ИИ создает новые векторы атак — злоумышленники могут использовать нейросети для поиска скрытых связей в разрозненных данных, поэтому внедрение защитных ИИ-агентов станет критически важным в ближайшее десятилетие .

💬 Цитаты

«Агенты обрабатывают мультимодальную информацию одновременно, рассуждая, обучаясь и принимая решения.»

Спикер Google 01:07

«Gemini 1.5 Pro с контекстом в 1 миллион токенов позволяет вносить масштабные изменения во всю вашу кодовую базу.»

Спикер Google 26:03
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Мультимодальность
Способность ИИ-модели одновременно понимать и обрабатывать данные разных типов: текст, изображения, видео и аудио.
Контекстное окно
Объем данных (измеряется в токенах), который ИИ может удерживать в «краткосрочной памяти» при обработке одного запроса.
Трансформеры
Архитектура нейронных сетей, лежащая в основе современных языковых моделей, изначально разработанная Google.
RAG (Retrieval Augmented Generation)
Технология, позволяющая ИИ-модели искать информацию во внешних источниках (базах данных компании) перед генерацией ответа.
📊 Цифры
🗓 Хронология
  1. Март-Апрель 2024 Выпуск модели Gemini 1.5 Pro и презентация на Google Cloud Next.
  2. 2025 Планы по пересмотру корпоративных медицинских страховок на примере демо-сценария.
⚖️ Другая сторона
Искусственный интеллект Gemini 1.5 Pro Google Cloud Next Vertex AI Google Vids Google Workspace