Иллюзия автономии: почему будущее ИИ-агентов за жестким кодом

The Cognitive Revolution 2,8 тыс. 2 ч 3 мин 19 мин 18.09.2024
Главное

Чем узкоспециализированнее ИИ-агент, тем выше его шансы на реальный успех, в то время как попытки наделить нейросети полноценным долгосрочным планированием пока обречены на провал. Вопреки мифам о полной автономности, ближайшие два года в индустрии будут править жестко закодированные прескриптивные системы со строгим участием человека. Глава платформы Agent.ai Андрей Оприсан объясняет, почему связка человека и алгоритма всегда побеждает одиночные решения и как устроен изнутри бизнес на автоматизации рутины.

🤖 Эволюция ИИ-агентов: от завышенных ожиданий к прагматичной автоматизации 6:16

От «вакуумного» автопилота к четким границам: переопределение ИИ-агентов 6:16

Полтора года назад, сразу после релиза модели GPT-4, технологическую индустрию захлестнула волна колоссального интереса к концепции автономных ИИ-агентов. Такие проекты, как BabyAGI и AutoGPT, сформировали у пользователей завышенные ожидания. Многим казалось, что достаточно поставить перед системой абстрактную высокоуровневую цель, и она самостоятельно сформирует многоуровневый план, найдет оптимальные пути решения и вернется с идеальным результатом. Однако на практике подобные полностью автономные эксперименты не увенчались успехом. Как отмечает Андрей Оприсан (Andrei Oprisan), Engineering Lead в компании Agent.ai, за прошедшее время само понятие «агент» неоднократно размывалось, смещалось и адаптировалось рынком.

Сегодня профессиональное сообщество приходит к более реалистичному и взвешенному пониманию этой технологии. Андрей Оприсан дает ИИ-агенту четкое рабочее определение: это полуавтономная система, способная выполнять конкретные задачи или принимать решения от имени пользователя, но со строгим и обязательным участием человека в цикле (human-in-the-loop). Для достижения предсказуемых бизнес-результатов критически важно поручать ИИ исключительно небольшие, понятные, конкретные и жестко ограниченные функции. Вместо иллюзорной погони за абсолютной автономией разработчикам следует проектировать гибридные архитектуры, в которых базовая рутинная работа делегируется модели, а финальный контроль и стратегические решения остаются за человеком.

Сила узкой специализации: почему один агент для всего — это рецепт катастрофы 7:25

Главное правило успешной интеграции искусственного интеллекта в реальные бизнес-процессы на текущем этапе — максимальное сужение его зоны ответственности. Андрей Оприсан подчеркивает: чем уже специализация агента и чем более ограничен набор его явных возможностей, тем выше математическая вероятность успешного выполнения задачи и тем ниже риск столкнуться с неконтролируемыми галлюцинациями. Попытки создать универсальный автономный ИИ, способный решать любые задачи «под солнцем», сегодня являются гарантированным рецептом для провала и разочарования.

В обозримом будущем рабочее место квалифицированного сотрудника будет усилено не одним всемогущим ИИ, а десятками или даже сотнями мелких, узкоспециализированных цифровых помощников. В качестве примера Андрей Оприсан приводит повседневные задачи «белых воротничков»: утренний разбор, фильтрация и приоритизация входящей почты на основе меняющегося контекста, или анализ календаря с автоматической подготовкой кратких информационных справок о ключевых участниках предстоящих деловых встреч. Ранее в разговоре ведущие вскользь упомянули амбициозные планы Agent.ai по созданию глобального маркетплейса таких агентов, визуального no-code конструктора для гражданских разработчиков, а также концепцию полноценной профессиональной социальной сети для ИИ, однако эти направления подробно разбираются в последующих главах статьи.

Ярким практическим подтверждением философии узких инструментов выступает флагманский агент самой платформы Agent.ai, предназначенный для генерации глубоких аналитических отчетов о компаниях. Пользователю достаточно передать системе доменное имя организации, чтобы запустить масштабный процесс сбора данных. На выходе клиент получает структурированный документ, содержащий общую информацию, списки лиц, принимающих решения, их верифицированные контакты, а также аналитику трафика из LinkedIn и X, обзор продуктовой линейки, ценообразование и стратегические рекомендации по продажам. Под капотом этого инструмента скрывается более 100 последовательных шагов, распределенных по 20 различным смысловым разделам. Архитектура процесса построена прескриптивно: алгоритм жестко детерминирован кодом, а языковые модели привлекаются локально, только там, где необходима творческая гибкость. При этом выводы моделей обязательно упаковываются в строго заданные структуры данных (structured outputs), что позволяет эффективно проводить симуляции, валидировать результаты и масштабировать процессы без потери качества.

Три кита, которых не хватает языковым моделям: планирование, детекция ошибок и самокоррекция 11:32

Чтобы совершить качественный переход от жестко прописанных цифровых инструкций (workflows) к подлинной автономии, индустрии требуется преодолеть фундаментальные ограничения современных больших языковых моделей. Андрей Оприсан убежден, что разработчики программного обеспечения будут вынуждены опираться на строгие прескриптивные сценарии еще как минимум от 6 до 24 месяцев. На сегодняшний день выделяются три ключевые слабости LLM в контексте агентных систем:

Без четкого математического определения объективной истины (ground truth) модели не способны осуществлять надежное самоисправление на лету (self-correction). Андрей Оприсан отмечает, что эти академические проблемы решаются учеными уже не одно десятилетие. Будучи студентом знаменитого профессора Яна Лекуна (Yann LeCun) — главы ИИ в Meta и пионера в области сверточных нейросетей, — Андрей еще 20 лет назад исследовал алгоритмические подходы к коррекции ошибок и определению доменных границ в нейросетевых структурах.

Создание систем универсального планирования без превращения их в предсказуемый шаблонный конструктор до сих пор остается главным вызовом для индустрии. Собеседники также кратко затронули технические аспекты оптимизации — использование локальных моделей, базы данных Pinecone вместо PGVector и методы сквозного шифрования для обеспечения приватности, однако эти темы станут центральными в главах 2, 3 и 4. Пока же ключевым правилом создания надежного софта остается золотое инженерное правило: задействовать искусственный интеллект исключительно в тех узлах, где без него невозможно обойтись, доверяя всю остальную логику классическому программированию.

🤖 Гибкая логика, безкод и экономика агентов: изнутри разработки Agent.ai 25:20

Умная маршрутизация: замена жесткого кода на языковые модели 26:39

Индустрия автоматизации процессов долгое время опиралась на жестко заданные правила. Как отмечает ведущий инди-разработчик и хост, традиционный no-code требует точных совпадений строк или сложных регулярных выражений для условного ветвления. Платформа Agent.ai пошла принципиально иным путем, доверив принятие решений языковым моделям на основе неструктурированных или полуструктурированных данных.

Андрей Оприсан (Andrei Oprisan) подчеркивает, что современные LLM на удивление эффективны в разборе комплексной логики ветвления (if-then-else). Человеку сложно предусмотреть и формализовать в коде абсолютно все сценарии поведения системы, тогда как языковые модели отлично справляются со сложными вложенными циклами и обработкой ошибок. Эксперту бывает трудно безошибочно составить многоуровневый цикл с операторами continue внутри циклов while или for, но ту же задачу можно просто и надежно объяснить модели обычными словами.

Ранее в разговоре собеседники упоминали, что текущие LLM все еще имеют серьезные ограничения в глубоком автономном планировании, однако задачи маршрутизации и трансляции неструктурированных потоков данных в предсказуемые структурированные выводы они решают успешно.

Эра гражданских разработчиков: создание софта на естественном языке 32:45

Развитие ИИ открывает двери для так называемых «гражданских разработчиков» (citizen AI builders) — людей без технического бэкграунда, способных создавать продвинутое программное обеспечение. В Agent.ai этот подход реализован через инструмент Smart Action Builder, где логику рабочего процесса можно описать простым текстом в чате. Например, достаточно попросить систему «запросить у пользователя видео с YouTube», и ИИ самостоятельно заполнит необходимые параметры: заголовки, переменные и глубину парсинга каналов. На текущий момент внутренние бенчмарки компании оценивают точность такой генерации в 80%.

Для снижения порога входа платформа внедряет библиотеку готовых шаблонов под конкретные вертикали маркетинга, продаж и клиентского сервиса. Пользователи могут запускать их в закрытом режиме «как есть» или создавать копии для тонкой настройки: добавлять или удалять шаги, менять каналы уведомлений и кастомизировать выводы под свои нужды. Андрей Оприсан (Andrei Oprisan) уверен, что благодаря обилию примеров и поддержке сообщества любой желающий сможет пройти путь от новичка до эксперта всего за несколько недель, обучаясь на быстрых ошибках.

Экосистема Agent.ai: App Store для искусственного интеллекта 33:39

Глобальное видение Agent.ai заключается в создании масштабной экосистемы ИИ-агентов, функционирующей по модели Apple App Store. Заходя на платформу, пользователь видит разделение на сеть агентов (Agent Network) и сеть людей (Human Network). Для привлечения создателей платформа предлагает бесплатное гарантированное распределение трафика — до 100 000 просмотров в месяц на одного агента. Разработчики могут публиковать бесплатные базовые версии для сбора отзывов либо выпускать Pro-версии с расширенными возможностями кастомизации.

Ранее в разговоре упоминалось, что детальная стратегия монетизации и кредитная система будут разобраны отдельно, поскольку затраты на работу агентов сильно разнятся в зависимости от количества шагов и подключенных баз данных. На этапе альфа-тестирования компания самостоятельно наполняет рынок десятками агентов, ориентируясь на маркетинговые исследования. При этом пользовательская база платформы растет стремительно, превысив отметку в 40 000 человек. Чтобы защитить клиентов от утечки персональных данных, Agent.ai внедряет строгий процесс модерации и верификации приложений, аналогичный мобильным сторам.

Хотя концепция интеграции агентов в рабочие процессы в качестве полноценных членов команд и формирование специализированной профессиональной соцсети будут подробно рассмотрены в заключительной главе статьи.

RAG против дообучения: как добиться предсказуемости в бизнес-задачах 44:43

Когда речь заходит об оптимизации ИИ для генерации сложных рабочих процессов, возникает классическая дилемма: использовать RAG (поисково-ориентированную генерацию) или дообучать веса моделей (fine-tuning). Вопреки историям о частых неудачах RAG в индустрии, в Agent.ai эта технология показала себя на удивление эффективно. Инженеры компании собрали библиотеку из нескольких сотен эталонных примеров — от простейших до максимально комплексных. По словам Андрея Оприсана, ключевой фактор успеха здесь — точная настройка размера окна документов и зон их перекрытия. Анатомия среднего агента на платформе включает шесть шагов, описываемых JSON-объектом из шести атрибутов, что позволяет четко рассчитать оптимальный объем передаваемых данных.

Эксперименты с дообучением моделей (fine-tuning) в аналогичных сценариях привели к росту числа ложных срабатываний (false positives). Поскольку спектр намерений пользователей в бизнес-задачах вполне предсказуем, классический RAG в связке с крупными моделями продемонстрировал куда более стабильные результаты. Важнейшим элементом архитектуры стал внутренний инструмент оценки качества ответов, занимающий всего 100–200 строк кода. Он использует отдельный ИИ-запрос с примерами (few-shot), который валидирует работу основной модели и выдает структурированный JSON-вердикт по шкале качества.

Локальные модели как полигон для быстрых итераций 48:53

Важным практическим советом для разработчиков, стремящихся к стабильности систем, является отказ от жесткой привязки к неверсионированным облачным API. Проприетарные модели (такие как последние сборки GPT-4) регулярно обновляются провайдерами без предупреждения, что может мгновенно сломать логику продакшена. Андрей Оприсан (Andrei Oprisan) рекомендует начинать тестирование и отладку на локальных или изолированных хостинг-версиях моделей, таких как фиксированные чекпоинты Llama 2 или Llama 3. Наличие небольших специализированных моделей, работающих прямо на устройстве (on-device), позволяет проводить итерации кратно быстрее и получать более предсказуемые результаты.

Отработав базовую логику на малых локальных архитектурах, команда Agent.ai постепенно переходит к масштабированию задач на коммерческие системы с большим контекстным окном, такие как Claude, которые необходимы для глубокой персонализации. При этом подход к RAG приходится адаптировать под каждую модель, поскольку они по-разному реагируют на промпты и контекст. Тем не менее, локальный запуск остается идеальным решением для 99% базовых сценариев разработки и тестирования.

🛡️ Безопасность данных и магия «цепочек рассуждений» 50:12

В процессе масштабирования систем на базе ИИ разработчики неизбежно сталкиваются с двумя фундаментальными вызовами: как обеспечить абсолютную приватность пользовательской информации и как заставить модель не просто выдавать ответ, а по-настоящему «размышлять». Андрей Оприсан (Andrei Oprisan) уверен, что ответы на эти вопросы лежат в области гибридных облачных вычислений и специфических методов дообучения, которые имитируют работу человеческого мозга.

Конфиденциальность на новом уровне: изоморфное шифрование и Private Cloud 1:08:21

Вопрос безопасности данных часто становится камнем преткновения для внедрения ИИ в консервативных индустриях. Андрей Оприсан отмечает, что хотя 99% пользователей могут быть удовлетворены стандартными корпоративными соглашениями (Enterprise Agreements) от OpenAI или Anthropic, гарантирующими, что данные не будут использованы для обучения моделей , для медицинских или финансовых организаций этого недостаточно.

Оприсан делится личным опытом: он использует локальные модели для индексации собственных финансовых записей и налоговых документов, потому что даже при наличии всех протоколов безопасности риск утечки в облако остается психологическим барьером . Однако будущее, по его мнению, не за полностью локальными системами, а за гибридным подходом, который сейчас активно продвигает Apple.

Концепция Apple Intelligence и «частного облака» (Private Cloud Compute) представляет собой архитектурный прорыв . Ключевые особенности этого подхода:

Андрей подчеркивает, что такая архитектура позволяет получить «неограниченные облачные ресурсы и лучшие ответы быстрее», сохраняя при этом уровень доверия, сопоставимый с хранением данных на отключенном от сети жестком диске .

Искусство дообучения: почему Chain of Thought важнее объёма данных 1:10:19

Когда речь заходит о повышении качества работы агентов, простого предоставления данных (RAG), о котором шла речь ранее, бывает недостаточно. Для решения сложных логических задач требуется дообучение (fine-tuning), но не на простых парах «вопрос-ответ», а на цепочках рассуждений (Chain of Thought, CoT).

Андрей Оприсан сравнивает процесс подготовки данных для CoT с обучением стажера: «Вам нужно собрать тренировочные данные, которые включают не только финальные выходные данные, но и очень подробные промежуточные этапы рассуждений» . Это критически важно для математических задач, юридического анализа и сложного программирования.

Основные инсайты Андрея и Натана Лабенца по работе с CoT:

  1. Качество важнее количества: Натан отмечает, что вместо 10 000 примеров часто достаточно всего 10 «золотых стандартов» . Если у вас есть 10 безупречно описанных шагов решения задачи, модель схватывает логику гораздо лучше, чем на тысячах зашумленных примеров.
  2. Проблема «скрытого мышления»: Интернет заполнен результатами человеческой деятельности, но на нем почти нет данных о том, как люди пришли к этим результатам. Рассуждения обычно остаются «субвокальными» — внутри мозга эксперта .
  3. Синтетические данные: Один из эффективных методов — использование мощных моделей (вроде GPT-4) для деконструкции задачи. Можно попросить модель: «Разбей это решение на мельчайшие логические шаги», а затем использовать эти цепочки для дообучения более компактных и дешевых моделей .
  4. Разделение ответственности: Если цепочка рассуждений становится слишком сложной, Андрей рекомендует разделять её на две разные задачи. Это позволяет избежать ситуации, когда скрытые предубеждения модели в одной области начинают влиять на точность выводов в другой .

В конечном итоге, дообучение на CoT позволяет маленьким моделям (например, с 7 миллиардами параметров) показывать результаты в планировании, сопоставимые с гигантами, за счет узкой специализации на конкретных логических паттернах .

🛠️ Дилемма персонализации, экономика ИИ-платформ и выбор инфраструктуры данных 1:18:31

Парадокс глубокого контекста: барьеры на пути к истинной персонализации 1:18:31

Создание по-настоящему полезного ИИ-агента неизбежно упирается в проблему его глубокой кастомизации под конкретного пользователя. Поверхностные инструкции в промптах не позволяют добиться точного воспроизведения человеческого стиля работы. В ходе эксперимента по обучению модели писать тексты «от своего лица» ведущий подкаста Натан Лабен обнаружил, что популярные методы низкоранговой адаптации (LoRA) неплохо копируют индивидуальный стиль, но практически не способны усваивать новые факты. Для полноценной имитации автора ИИ должен оперировать колоссальным объемом контекста.

Главная сложность заключается в том, где именно хранятся эти данные. Чтобы агент писал аутентичные письма и сообщения, ему необходим доступ к пятилетней истории переписки в Gmail, архивам Slack и терабайтам других личных материалов. Это создает серьезный вызов безопасности: если пользователи готовы доверять свои конфиденциальные архивы признанным ИТ-гигантам вроде OpenAI или Google, то передавать десятки миллионов токенов чувствительной информации неизвестным стартапам большинство не решится.

Как отметил Андрей Оприсан (Andrei Oprisan), в Agent.ai эту проблему решают за счет интеграции с Google Calendar, Google Drive и Gmail. Продукту помогает институциональное доверие к родительской компании HubSpot, имеющей огромный опыт управления клиентскими данными (CRM). И хотя в индустрии развиваются концепции изоморфного шифрования векторов и локального проксирования через приватные дата-центры, детально рассмотренные в предыдущих главах, коммерческих решений корпоративного уровня для этих технологий на рынке пока нет. Ситуация осложняется и тем, что обычные векторные эмбеддинги обратимы: злоумышленник, получивший к ним доступ, может легко восстановить исходный текст. На этапе развития ИИ-агентам необходим бесшовный real-time RAG, который берет на себя регулярное indexing-управление, обновление метаданных и очистку устаревшей информации.

Экономика Agent.ai: кредитная система, маркетплейс и удержание билдеров 1:28:30

В сфере ИИ-сервисов действует старое правило: если вы не платите за продукт, значит, вы сами являетесь продуктом. Однако платформа Agent.ai сейчас находится в промежуточной фазе — её инструментарий полностью бесплатен для пользователей. Финансовая поддержка HubSpot и стратегическое видение Дхармеша Шаха (Dharmesh Shah) позволяют команде активно масштабироваться, избегая мгновенного банкротства из-за высоких инфраструктурных затрат при вирусном росте.

На текущем этапе на платформе действует упрощенная кредитная система: один запуск агента списывает один условный кредит. До конца года разработчики планируют внедрить возможность покупки дополнительных токенов, что совпадет с запуском полноценной системы монетизации для создателей агентов. Главная цель компании сейчас — набрать критическую массу пользователей и протестировать реальные сценарии использования на сотнях тысяч клиентов. Основной фокус направлен на автоматизацию маркетинга, продаж и клиентского сервиса — направлений, наиболее близких экосистеме HubSpot.

Чтобы превратить платформу в процветающую экосистему, Agent.ai разрабатывает комплексную стратегию привлечения сторонних инженеров-разработчиков. Она включает в себя несколько ключевых элементов:

Разработчики смогут разделять свои продукты на бесплатные (Free) и продвинутые (Pro) версии. Платные агенты будут отличаться возможностью подключения большего числа закрытых источников данных, требующих повышенных вычислительных затрат.

Инфраструктурный выбор: почему специализированный Pinecone побеждает универсальный PGVector 1:37:08

Обсуждая технический стек Agent.ai, Андрей Оприсан рассказал, что их команда из 12–13 человек сохраняет высочайшую скорость разработки и деплоит обновления десятки раз в день. Бэкенд платформы написан на Python, фронтенд базируется на Next.js и TypeScript, а вся инфраструктура развернута на базе автоматически масштабируемых сервисов AWS. Важнейшей частью этой архитектуры является работа с векторными хранилищами.

Натан Лабен поднял популярный среди разработчиков вопрос: достаточно ли использовать стандартное расширение PGVector для реляционной базы данных Postgres, или необходимо внедрять специализированные решения? Андрей Оприсан признал, что в современных синтетических тестах производительность PGVector сравнялась или даже превзошла показатели таких систем, как Qdrant или Pinecone. Тем не менее, Agent.ai делает однозначный выбор в пользу Pinecone.

Этот выбор продиктован исключительно соображениями продуктовой зрелости и удобства эксплуатации:

Философия инженерной команды Agent.ai формулируется просто: выбирать максимально надежные специализированные инструменты, не усложнять архитектуру без необходимости и делать всё ради обеспечения максимальной скорости доставки продукта пользователям.

🌐 Экосистема ИИ-агентов и будущее труда: от профессиональных сетей до автономных команд 1:41:04

Команда мечты: почему роботы не заменят людей, а избавят от рутины 1:41:04

Обсуждение будущего рынка труда часто скатывается в панику. Ведущий вспоминает недавний кейс компании Klarna, чей генеральный директор открыто заявил о сокращении потребности в 700 сотрудниках службы поддержки благодаря внедрению эффективного чат-бота. Однако Андрей Оприсан (Andrei Oprisan) смотрит на ситуацию более оптимистично и прагматично. С его точки зрения, ИИ-агенты — это высокоэффективные, специализированные полуавтономные приложения, а не прямая угроза рабочим местам.

Человек всегда останется в контуре управления. Именно люди будут определять критерии качества, задавать контекст и направлять цифровых помощников. Оприсан уверен, что агенты станут полноценными членами команд на ежедневной основе. Для соло-предпринимателей или небольших компаний такой агент может стать тем самым незаменимым сотрудником, который разгрузит основателя.

Полная автоматизация сложных процессов «под ключ» в ближайшее время маловероятна. Андрей приводит историческую аналогию: появление банкоматов не уничтожило профессию банковского клерка, а лишь изменило её, сместив фокус на более глубокое взаимодействие с клиентами. Интеграция ИИ позволит людям делегировать до 80% рутинных задач, таких как монотонный ввод данных или копирование информации между неэффективными корпоративными системами. Освободившееся время сотрудники смогут посвятить стратегии, творчеству и управлению процессами. В конечном итоге связка «человек плюс агент» всегда будет побеждать как чистого человека, так и чистый ИИ.

LinkedIn для ИИ: зачем агентам собственная профессиональная сеть 1:44:40

По мере того как задачи, выполняемые ИИ, становятся более комплексными, агенты начинают объединяться в целые «команды» или «рои» (swarms) для совместного решения проблем. В таких условиях бизнесу необходим прозрачный инструмент для оценки их эффективности. По аналогии с человеческой сетью LinkedIn, платформы вроде Agent.ai выстраивают полноценную профессиональную социальную сеть для ИИ-агентов.

В этой экосистеме у каждого агента появится собственный профиль, содержащий несколько ключевых блоков:

Такой подход позволяет прозрачно оценивать репутацию цифровых специалистов на рынке. Андрей Оприсан подчеркивает, что Agent.ai сознательно фокусируется на сегменте малого бизнеса и соло-предпринимателей (компании от 0 до 100 сотрудников), а не на огромных корпорациях. Профессиональная сеть помогает им находить нужных агентов или выходить напрямую на их разработчиков для кастомизации под конкретные нужды. Ранее в разговоре собеседники уже затрагивали смежные темы, такие как маркетплейс ИИ и концепция гражданских разработчиков.

Регуляторный вакуум и этика создателей 1:48:51

Стремительный рост технологий создает серьезные этические и правовые вызовы. Андрей Оприсан признает, что технологии развиваются кратно быстрее, чем законодательство, и этот регуляторный разрыв выглядит пугающе. Особенно остро эта проблема встает в периоды крупных политических событий, например, выборов в США, когда риски использования сгенерированных ИИ голосов и цифровых двойников критически высоки.

В условиях, пока государственное регулирование отстает, ответственность ложится на плечи создателей платформ. Разработчики должны самостоятельно внедрять жесткие меры безопасности, контролировать предвзятость данных и вводить внутренние ограничения. По мнению Оприсана, компаниям необходимо иметь смелость отказывать потенциальным клиентам, если их сценарии использования нарушают этические нормы. Главная задача — найти баланс, при котором регуляторные барьеры защитят общество, но не задушат инновации в зародыше.

В долгосрочной перспективе, если автоматизация начнет резко влиять на определенные профессии, потребуются масштабные государственные решения, включая обсуждение безусловного базового дохода (UBI). Ведущий также предлагает практические шаги для переходного периода: например, введение криптографических протоколов обязательной идентификации ИИ-агентов, чтобы пользователь всегда четко знал, кто контролирует агента и с кем именно ведется коммуникация.

На пороге «пробуждения агентов»: ожидание новых LLM и скачок автономности 1:51:57

Эволюция больших языковых моделей движется понятными циклами: каждые два года происходит качественный шаг вперед — от GPT-2 в 2019 году до GPT-4 в 2023-м. Сейчас индустрия находится на пороге очередного технологического сдвига. Ведущий отмечает, что пока разработчики по всему миру выстраивают инфраструктуру, программную «обвязку» (scaffolding) и системы ограничений вокруг текущих моделей, индустрия замерла в ожидании следующего поколения ИИ — условных GPT-5 или GPT-6.

Появление этих моделей на уже подготовленной инфраструктуре способно мгновенно перевести агентов из статуса простых чат-ботов в категорию умеренно автономных систем. В качестве примера приводится автономный ИИ-менеджер по продажам (SDR), который сможет не просто отвечать на входящие запросы, но и самостоятельно проводить глубокие исследования рынка и формировать воронку продаж.

Андрей Оприсан соглашается, что появление условной GPT-6 с контекстным окном в 100 миллионов токенов кардинально изменит правила игры. Однако он призывает к реализму: даже сверхмощная модель не решит автоматически все проблемы с объективным рассуждением и галлюцинациями. Бизнесу по-прежнему придется интегрировать эти инструменты в реальные рабочие процессы, определять критерии «настоящей правды» (ground truth) и менять привычные воркфлоу. Лучшая тактика для компаний сегодня — не поддаваться панике, а активно внедрять доступные инструменты, тестировать их и учиться извлекать из них реальную коммерческую выгоду. В финале беседы Андрей отмечает, что Agent.ai активно расширяет команду и ищет амбициозных специалистов в инженерии и маркетинге для совместного построения этого будущего.

💬 Цитаты

«The more narrow definition, the more narrow the set of capabilities an agent has, the more likely it is to succeed.»

«LLMs are fairly bad at actually planning and actually explaining helping a person understand where that uncertainty is.»

«Человеку сложно предусмотреть и формализовать в коде абсолютно все сценарии поведения системы, тогда как языковые модели отлично справляются со сложными вложенными циклами и обработкой ошибок.»

Андрей Оприсан 28:00

«Chain of Thought — это как если бы у вас был стажер: вам нужно объяснять каждый шаг и следить за тем, чтобы данные были тщательно курированы.»

Андрей Оприсан 71:10

«Интернет не содержит цепочек рассуждений; мы видим только тени — входные и выходные данные, но то, что происходило в мозгу человека, обычно не записывается.»

Натан Лабенц 75:10

«Я думаю, что связка «человек плюс агент» в большинстве случаев будет побеждать решение, состоящее только из агента или только из человека»

Андрей Оприсан 108:24
👥 Спикеры
📖 Термины
RAG (Retrieval-Augmented Generation)
Архитектура, сочетающая поиск по внешней базе знаний с генеративными возможностями языковой модели для снижения галлюцинаций.
Chain of Thought
Метод рассуждения моделей посредством последовательных логических шагов, значительно улучшающий качество решения сложных задач.
Изоморфное шифрование
Технология шифрования данных на уровне эмбеддингов, позволяющая обрабатывать их в облаке без риска раскрытия конфиденциальной информации.
Искусственный интеллект Андрей Оприсан Agent.ai ИИ-агенты RAG Chain of Thought