Сфера искусственного интеллекта развивается настолько стремительно, что даже профессионалам в IT бывает сложно уследить за всеми изменениями. Мартин, ведущий канала IBM Technology, представляет семь ключевых концепций — от автономных агентов до теоретического супер-интеллекта — которые определяют будущее технологий уже сегодня.
🤖 ИИ-агенты: переход от чат-ботов к действиям 0:37
Первым и одним из самых обсуждаемых терминов являются ИИ-агенты (AI Agents). По словам Мартина, сегодня «каждый и его бабушка» пытаются создать следующее поколение таких систем . В отличие от обычных чат-ботов, которые просто отвечают на запросы пользователя один за другим, агенты способны рассуждать и действовать автономно для достижения поставленных целей .
Процесс работы ИИ-агента состоит из цикличных этапов:
- Восприятие: агент изучает окружающую среду и контекст.
- Рассуждение: на этом этапе модель определяет наиболее эффективные следующие шаги.
- Действие: выполнение плана, построенного на этапе рассуждения.
- Наблюдение: анализ результатов действий, после чего цикл повторяется до достижения цели .
Примеры применения агентов охватывают самые разные сферы: от туристического агента, бронирующего поездку, до аналитика данных, ищущего тренды в квартальных отчетах. В ИТ-сфере агент может выступать в роли DevOps-инженера: обнаруживать аномалии в логах, запускать контейнеры для тестирования исправлений и откатывать некорректные развертывания .
🧠 Большие модели рассуждения (LRM) 1:45
Второй термин тесно связан с первым. ИИ-агенты обычно строятся на базе специфической формы больших языковых моделей (LLM), известных как большие модели рассуждения (Large Reasoning Models, LRM) .
Это специализированные модели, прошедшие дообучение (fine-tuning) с акцентом на логику. Если обычные LLM генерируют ответ мгновенно, то модели рассуждения обучены решать задачи пошагово .
Особенности обучения LRM:
- Используются задачи с верифицируемыми правильными ответами (математика, программный код, проверяемый компилятором).
- Применяется обучение с подкреплением (reinforcement learning).
- Модель учится выстраивать внутреннюю «цепочку мыслей» (chain of thought) .
Мартин отмечает, что когда чат-бот делает паузу перед ответом с пометкой «думаю» — это работа модели рассуждения, которая разбивает сложную проблему на мелкие шаги .
📊 Векторные базы данных и эмбеддинги 2:54
На более низком техническом уровне ключевую роль играют векторные базы данных (Vector Databases). В них данные (тексты, изображения) хранятся не в виде обычных файлов, а преобразуются с помощью модели эмбеддинга в векторы — длинные списки чисел .
Преимущество такого подхода заключается в возможности семантического поиска:
- Вектор фиксирует смысловое значение контента .
- Поиск выполняется как математическая операция по нахождению векторов, расположенных близко друг к другу.
- Система может найти изображения, статьи или музыку, которые «похожи» по смыслу на исходный запрос, даже если в них нет прямых совпадений по ключевым словам .
🏗️ RAG: генерация с дополненной выборкой 4:26
Четвертый термин — RAG (Retrieval Augmented Generation). Эта технология использует векторные базы данных для обогащения промптов (запросов), направляемых в LLM .
Механика работы RAG:
- Запрос пользователя превращается в вектор.
- В векторной базе данных выполняется поиск похожей информации (например, из внутренних документов компании).
- Найденные данные добавляются в промпт.
- LLM генерирует ответ, основываясь на этой актуальной и специфической информации .
Примером может служить вопрос сотрудника о внутренней политике компании. Система RAG найдет нужный раздел в «Справочнике сотрудника» и передаст его модели, чтобы та дала точный ответ .
🔌 Протокол контекста модели (MCP) 5:36
Пятый термин — Model Context Protocol (MCP) — Мартин называет «по-настоящему захватывающим» . Для того чтобы ИИ был полезен, ему нужно взаимодействовать с внешними данными: базами данных, репозиториями кода или серверами электронной почты.
Раньше разработчикам приходилось создавать уникальные соединения для каждого нового инструмента. MCP стандартизирует этот процесс :
- Он обеспечивает единый способ предоставления контекста для LLM.
- MCP-сервер выступает связующим звеном, через которое ИИ понимает, как взаимодействовать с любой внешней системой .
🧩 Mixture of Experts (MoE): эффективность масштабирования 6:42
Идея Mixture of Experts (MoE, «Смесь экспертов») существует с 1991 года, но стала критически важной только сейчас . Эта архитектура разделяет одну огромную модель на множество специализированных нейронных подсетей («экспертов»).
Принцип работы MoE:
- Модель может содержать сотни экспертов.
- Механизм маршрутизации (routing) активирует только тех экспертов, которые необходимы для конкретной задачи.
- Затем происходит процесс слияния (merge) их ответов в единый результат .
Это позволяет значительно увеличить размер модели без пропорционального роста вычислительных затрат. Мартин приводит в пример серию моделей IBM Granite 4.0: модель может иметь миллиарды параметров, но в момент генерации конкретного токена используется лишь малая их часть .
⚡ ASI: искусственный супер-интеллект 8:15
Седьмой термин — ASI (Artificial Super Intelligence) — является главной целью ведущих ИИ-лабораторий мира. Мартин подчеркивает, что на данный момент это чисто теоретическая концепция, и неизвестно, будет ли она когда-либо реализована .
Иерархия развития ИИ выглядит так:
- Текущие модели: постепенно приближаются к уровню AGI.
- AGI (общий ИИ): гипотетическая система, способная выполнять любые когнитивные задачи на уровне человека-эксперта .
- ASI (супер-интеллект): интеллект, превосходящий человеческий уровень во всех сферах.
Главная особенность ASI — способность к рекурсивному самосовершенствованию. Система сможет перепроектировать и обновлять саму себя, становясь умнее с каждым циклом . По мнению Мартина, такое развитие событий может либо решить величайшие проблемы человечества, либо создать совершенно новые угрозы, которые мы даже не можем себе представить .
🎓 Анонс IBM Tech Exchange 9:46
В завершение видео Мартин и его коллега Грэм пригласили зрителей на конференцию IBM Tech Exchange, которая пройдет в Орландо в октябре этого года . Программа мероприятия включает: