7 ключевых концепций ИИ от IBM: от автономных агентов до супер-интеллекта

Сфера искусственного интеллекта развивается настолько стремительно, что даже профессионалам в IT бывает сложно уследить за всеми изменениями. Мартин, ведущий канала IBM Technology, представляет семь ключевых концепций — от автономных агентов до теоретического супер-интеллекта — которые определяют будущее технологий уже сегодня.

🤖 ИИ-агенты: переход от чат-ботов к действиям 0:37

Первым и одним из самых обсуждаемых терминов являются ИИ-агенты (AI Agents). По словам Мартина, сегодня «каждый и его бабушка» пытаются создать следующее поколение таких систем . В отличие от обычных чат-ботов, которые просто отвечают на запросы пользователя один за другим, агенты способны рассуждать и действовать автономно для достижения поставленных целей .

Процесс работы ИИ-агента состоит из цикличных этапов:

Восприятие: агент изучает окружающую среду и контекст.
Рассуждение: на этом этапе модель определяет наиболее эффективные следующие шаги.
Действие: выполнение плана, построенного на этапе рассуждения.
Наблюдение: анализ результатов действий, после чего цикл повторяется до достижения цели .

Примеры применения агентов охватывают самые разные сферы: от туристического агента, бронирующего поездку, до аналитика данных, ищущего тренды в квартальных отчетах. В ИТ-сфере агент может выступать в роли DevOps-инженера: обнаруживать аномалии в логах, запускать контейнеры для тестирования исправлений и откатывать некорректные развертывания .

🧠 Большие модели рассуждения (LRM) 1:45

Второй термин тесно связан с первым. ИИ-агенты обычно строятся на базе специфической формы больших языковых моделей (LLM), известных как большие модели рассуждения (Large Reasoning Models, LRM) .

Это специализированные модели, прошедшие дообучение (fine-tuning) с акцентом на логику. Если обычные LLM генерируют ответ мгновенно, то модели рассуждения обучены решать задачи пошагово .

Особенности обучения LRM:

Используются задачи с верифицируемыми правильными ответами (математика, программный код, проверяемый компилятором).
Применяется обучение с подкреплением (reinforcement learning).
Модель учится выстраивать внутреннюю «цепочку мыслей» (chain of thought) .

Мартин отмечает, что когда чат-бот делает паузу перед ответом с пометкой «думаю» — это работа модели рассуждения, которая разбивает сложную проблему на мелкие шаги .

📊 Векторные базы данных и эмбеддинги 2:54

На более низком техническом уровне ключевую роль играют векторные базы данных (Vector Databases). В них данные (тексты, изображения) хранятся не в виде обычных файлов, а преобразуются с помощью модели эмбеддинга в векторы — длинные списки чисел .

Преимущество такого подхода заключается в возможности семантического поиска:

Вектор фиксирует смысловое значение контента .
Поиск выполняется как математическая операция по нахождению векторов, расположенных близко друг к другу.
Система может найти изображения, статьи или музыку, которые «похожи» по смыслу на исходный запрос, даже если в них нет прямых совпадений по ключевым словам .

🏗️ RAG: генерация с дополненной выборкой 4:26

Четвертый термин — RAG (Retrieval Augmented Generation). Эта технология использует векторные базы данных для обогащения промптов (запросов), направляемых в LLM .

Механика работы RAG:

Запрос пользователя превращается в вектор.
В векторной базе данных выполняется поиск похожей информации (например, из внутренних документов компании).
Найденные данные добавляются в промпт.
LLM генерирует ответ, основываясь на этой актуальной и специфической информации .

Примером может служить вопрос сотрудника о внутренней политике компании. Система RAG найдет нужный раздел в «Справочнике сотрудника» и передаст его модели, чтобы та дала точный ответ .

🔌 Протокол контекста модели (MCP) 5:36

Пятый термин — Model Context Protocol (MCP) — Мартин называет «по-настоящему захватывающим» . Для того чтобы ИИ был полезен, ему нужно взаимодействовать с внешними данными: базами данных, репозиториями кода или серверами электронной почты.

Раньше разработчикам приходилось создавать уникальные соединения для каждого нового инструмента. MCP стандартизирует этот процесс :

Он обеспечивает единый способ предоставления контекста для LLM.
MCP-сервер выступает связующим звеном, через которое ИИ понимает, как взаимодействовать с любой внешней системой .

🧩 Mixture of Experts (MoE): эффективность масштабирования 6:42

Идея Mixture of Experts (MoE, «Смесь экспертов») существует с 1991 года, но стала критически важной только сейчас . Эта архитектура разделяет одну огромную модель на множество специализированных нейронных подсетей («экспертов»).

Принцип работы MoE:

Модель может содержать сотни экспертов.
Механизм маршрутизации (routing) активирует только тех экспертов, которые необходимы для конкретной задачи.
Затем происходит процесс слияния (merge) их ответов в единый результат .

Это позволяет значительно увеличить размер модели без пропорционального роста вычислительных затрат. Мартин приводит в пример серию моделей IBM Granite 4.0: модель может иметь миллиарды параметров, но в момент генерации конкретного токена используется лишь малая их часть .

⚡ ASI: искусственный супер-интеллект 8:15

Седьмой термин — ASI (Artificial Super Intelligence) — является главной целью ведущих ИИ-лабораторий мира. Мартин подчеркивает, что на данный момент это чисто теоретическая концепция, и неизвестно, будет ли она когда-либо реализована .

Иерархия развития ИИ выглядит так:

Текущие модели: постепенно приближаются к уровню AGI.
AGI (общий ИИ): гипотетическая система, способная выполнять любые когнитивные задачи на уровне человека-эксперта .
ASI (супер-интеллект): интеллект, превосходящий человеческий уровень во всех сферах.

Главная особенность ASI — способность к рекурсивному самосовершенствованию. Система сможет перепроектировать и обновлять саму себя, становясь умнее с каждым циклом . По мнению Мартина, такое развитие событий может либо решить величайшие проблемы человечества, либо создать совершенно новые угрозы, которые мы даже не можем себе представить .

🎓 Анонс IBM Tech Exchange 9:46

В завершение видео Мартин и его коллега Грэм пригласили зрителей на конференцию IBM Tech Exchange, которая пройдет в Орландо в октябре этого года . Программа мероприятия включает:

Буткемпы и воркшопы.
Сертификации и живые демо-показы.
Специальную студию Lightboard, где Мартин будет проводить сессии вживую и обучать желающих технике создания видео с использованием прозрачной доски (лайтборда) .