Билл Цзя: вытеснят ли ИИ-агенты треть корпоративного софта?

DeepLearning.AI 3 тыс. 14 мин 4 мин 27.03.2025
Главное

На прошедшем технологическом мероприятии AI Dev 25 вице-президент по продукту в Meta Билл Цзя (Bill Jia) представил подробный анализ эволюции искусственного интеллекта от изолированных языковых моделей к автономным экосистемам агентов. В своем выступлении эксперт детально разобрал существующий технологический стек, инфраструктурные требования для масштабного инференса и экономический эффект от автоматизации бизнес-процессов. Ключевым тезисом сессии стал неизбежный переход корпоративного сектора на агентские рельсы в ближайшие годы.

🔄 От языковых моделей к автономным агентам: смена парадигмы 0:00

Современный этап развития индустрии ИИ характеризуется переходом от классических больших языковых моделей (LLM) к комплексным структурам — ИИ-агентам. Стандартная языковая модель работает по линейному принципу: пользователь передает входные данные, система обрабатывает их и возвращает финальный ответ. Несмотря на внутреннюю сложность архитектуры, общая логика взаимодействия «вход-выход» остается относительно простой и подходит преимущественно для решения повседневных справочных задач.

ИИ-агенты принципиально меняют этот подход, объединяя множество различных языковых моделей и интегрируя в них разветвленную бизнес-логику для выполнения комплексных цепочек задач. По словам Билла Цзя, разницу наглядно иллюстрирует логистический сценарий: если запросить у обычной LLM оптимальный способ добраться из Саут-Бей в Сан-Франциско к началу выступления в 9:45 утра, система выдаст стандартные рекомендации воспользоваться автомобилем или сервисами Uber/Lyft, оценив поездку примерно в один час. Однако в дождливый день реальная дорожная обстановка в 8:00 утра резко ухудшается, делая статический ответ неточным. Агент на базе LLM, напротив, способен непрерывно собирать актуальную информацию в режиме реального времени и динамически корректировать маршрут на основе внешних факторов. Еще одним примером полезности карманного агента спикер назвал экстренную подготовку к публичному выступлению, когда система способна сформировать структуру доклада всего за пять минут в условиях отсутствия готовых слайдов.

📊 Экономический эффект и масштаб внедрения в индустрии 2:40

Крупные технологические компании сегодня разворачивают масштабные инвестиции в создание агентских платформ, фиксируя начало бурного роста этого сегмента. Согласно аналитическим оценкам, озвученным в докладе, к 2028 году почти треть (около 33%) всего корпоративного программного обеспечения будет включать в себя встроенных ИИ-агентов.

Для коммерческих предприятий внедрение подобных технологий обещает прямую и измеримую финансовую выгоду. Билл Цзя привел следующие показатели эффективности:

🛠️ Архитектура агентских систем и технологический стек 3:47

Полноценное функционирование ИИ-агентов требует развертывания сложной ИТ-инфраструктуры, включающей базовые модели, цепочки специализированных инструментов (tool chains) и высокоуровневое программное обеспечение. Полноценная архитектура создания ИИ-агентов опирается на три фундаментальных компонента:

  1. Нижний уровень (инфраструктурный) — высокопроизводительные и надежные серверные среды для инференса (inference serving tiers). Поскольку весь агентский трафик конвертируется в конечные запросы (QPS) к серверам, стабильность этого слоя критична.
  2. Средний уровень — модульные агентские компоненты. Здесь связываются воедино разные типы LLM и пользовательские функции, описывающие намерения и бизнес-логику.
  3. Верхний уровень — программные интерфейсы API и комплекты разработки SDK. Они позволяют сторонним разработчикам оперативно обращаться к нижним слоям архитектуры для быстрой сборки гибких ИИ-помощников.

В рамках этой структуры ключевое значение имеет оптимизация вычислений. Спикер выделил роль фреймворка Jax, спроектированного специально для высокопроизводительного обучения и инференса больших моделей. Jax поддерживает работу с процессорами TPU и GPU от различных производителей, компилируя исполняемый код напрямую под характеристики конкретного оборудования. Это позволяет существенно снизить капитальные затраты на обработку миллионов пользовательских запросов. На более высоком уровне абстракции используется фреймворк Keras, позволяющий разработчикам абстрагироваться от бэкенда, будь то TensorFlow, PyTorch или Jax. На уровне физической инфраструктуры задействованы мощности Google Cloud, включая дата-центры, сетевые решения и специализированные чипы TPU.

🤖 Практические кейсы: Project Astra и Deep Research 6:32

Разработка платформ сопровождается созданием готовых прикладных решений. В качестве ключевых примеров были продемонстрированы два проекта: Project Astra и Deep Research.

Проект Deep Research ориентирован на автоматизацию комплексных аналитических задач. При необходимости подготовить исследовательскую работу агент самостоятельно осуществляет поиск релевантной информации в сети, собирает и структурирует данные, после чего генерирует подробный отчет с возможностью экспорта в Google Docs.

В свою очередь, Project Astra представляет собой мультимодального карманного ассистента. Обладая возможностями компьютерного зрения, слуха и синтеза речи, он способен воспринимать окружающий мир в режиме реального времени. В ходе продемонстрированного тестового сценария пользователь показал Project Astra набросок гоночного болида Формулы-1:

🌐 Эволюция моделей и приверженность Open Source 9:21

Стратегия развития ИИ-направления, основывающаяся на концепции AI-first компании с 2016 года, включает три ключевых вектора: ежегодный выпуск двух версий флагманских моделей Gemini, развитие инструментария и модуляризацию фреймворков. Текущим этапом этой эволюции является запуск модели Gemini 3 и сопутствующей открытой версии.

Важным свойством современных систем Билл Цзя назвал их нативную мультимодальность. Интерфейс Multimodal Live API позволяет моделям одновременно принимать на вход видео, аудио, изображения и текст, выдавая также комплексные мультимодальные ответы. Именно эта способность позволяет объединять модели в эффективные агентские сети.

В заключение спикер подчеркнул важность открытого исходного кода для индустрии. Начиная с релиза TensorFlow, разработчики последовательно открывают свои ключевые технологии, включая фреймворк Jax и компилятор OpenXLA. Для расширения доступности этих инструментов запущена совместная программа с платформой DeepLearning.AI, в рамках которой создаются онлайн-курсы, обучающие сообщество работе с новыми API и SDK для создания независимых ИИ-агентов.

💬 Цитаты

«ИИ-агенты могут объединять множество различных больших языковых моделей, интегрировать бизнес-логику и помогать в выполнении сложных задач.»

«Мы верим, что ИИ-агенты — это будущее нашего мира.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
ИИ-агент
Система на базе языковых моделей, способная автономно выполнять комплексные задачи, адаптируясь к меняющимся условиям.
Инференс
Процесс работы обученной нейросети по выполнению прогноза или генерации ответа на новые данные.
Мультимодальность
Способность модели одновременно обрабатывать и генерировать данные разных типов: текст, аудио, видео и изображения.
Jax
Специализированный фреймворк для высокопроизводительных вычислений и обучения больших языковых моделей.
QPS
Количество запросов в секунду, отправляемых к серверной системе.
📊 Цифры
🗓 Хронология
  1. 2016 год Переход к стратегии развития ИИ в качестве приоритетного направления (AI-first).
  2. 2026 год Текущий анонс и развертывание модели Gemini 3 на мероприятии AI Dev.
  3. 2028 год Ожидаемое достижение доли в 33% для агентских решений в корпоративном ПО.
⚖️ Другая сторона
Искусственный интеллект ИИ-агенты Билл Цзя Google Cloud Gemini 3 Jax