Паскаль Вайнбергер: «Будущее ИИ — в оркестрации рутинных задач»

Eye on AI 2,3 тыс. 57 мин 7 мин 15.06.2023
Главное

Искусственный интеллект стремительно трансформирует привычные рабочие процессы, превращая рутинное копирование данных в автоматизированные цепочки действий. В новом выпуске подкаста Eye on AI Паскаль Вайнбергер, сооснователь и генеральный директор стартапа Bardeen AI, подробно рассказывает о переходе от ранних моделей машинного обучения к современным генеративным системам. В центре дискуссии — концепция «оркестрационного слоя» интернета, которая способна избавить миллионы людей от рутинной офисной работы с помощью естественного языка.

🚀 От «лунных выстрелов» Telefonica к интеллектуальной автоматизации 0:29

Паскаль Вайнбергер начал свой путь в индустрии машинного обучения с изучения работ Рэя Курцвейла, который в 1980-х годах обучал небольшие нейросети генерации MIDI-файлов на основе стилей разных пианистов , . По словам Вайнбергера, уже тогда было очевидно, что ИИ способен не только распознавать паттерны, но и генерировать принципиально новый контент , .

До основания собственного стартапа Паскаль Вайнбергер руководил исследованиями в экспериментальной лаборатории «Alpha» (так называемом moonshot lab) телекоммуникационного гиганта Telefonica , . Эта лаборатория функционировала по модели классического стартап-инкубатора :

Одним из успешных примеров такой акселерации стал стартап в сфере ментального здоровья, который отслеживает и помогает предотвращать психологические кризисы на рабочем месте , .

Как отмечает Вайнбергер, в 2017–2018 годах индустрия машинного обучения находилась на совершенно ином этапе развития . В лаборатории Telefonica его команда фокусировалась на трех ключевых направлениях исследований:

  1. Объяснимость ИИ (Explainability / Debuggability): Разработка механизмов отладки классификационных моделей для понимания причин их ошибок, что критически важно в медицинских сценариях .
  2. Конфиденциальное машинное обучение (Federated Learning): Обучение моделей на распределенных пользовательских данных без необходимости их физического перемещения в единое облако , .
  3. Эмоциональный ИИ (Emotional AI): Распознавание человеческих эмоций для создания более естественных интерфейсов взаимодействия с компьютерами , .

💡 Эволюция Bardeen AI: от интерфейса командной строки на BERT к GPT-4 10:27

Идея создания стартапа Bardeen AI (названного в честь двукратного лауреата Нобелевской премии Джона Бардина ) возникла из личной боли основателей . Паскаль Вайнбергер и его партнер столкнулись с тем, что огромную часть их рабочего времени отнимали рутинные задачи: поиск кандидатов на LinkedIn, копирование данных профилей в JIRA-тикеты, рассылка писем и ручной перенос информации между вкладками браузера , .

Попытки использовать классические системы автоматизации процессов (RPA) или платформы вроде Zapier не увенчались успехом. По мнению Вайнбергера, существующие на рынке инструменты не обладали контекстным пониманием происходящего на экране пользователя , .

Первый прототип Bardeen AI, созданный три года назад, существенно отличался от текущей версии :

С появлением GPT-4 и аналогичных больших языковых моделей (LLM) проект пережил качественный скачок , . Использование современных ИИ-моделей позволило справиться с двусмысленностью пользовательских описаний и автоматически транслировать текстовые запросы в исполняемый программный код . Сегодня Bardeen предоставляет пользователям выбор: для простых задач можно задействовать более быструю GPT-3.5, а для комплексных процессов — GPT-4 или модели от компании Anthropic , .

🛠️ Архитектура автоматизации: Детерминированное исполнение против галлюцинаций LLM 33:32

Инструмент Bardeen функционирует непосредственно в браузере в формате расширения . По мнению Вайнбергера, это стратегическое решение, поскольку сегодня практически вся деятельность белых воротничков и офисных сотрудников перенесена в веб-приложения , . На текущий момент платформа интегрирована с более чем 70 популярными сервисами (включая Airtable, Notion, Google Sheets, Slack, Jira) и предлагает пользователям около 700 готовых сценариев автоматизации (аутбуков) .

Важной темой дискуссии стало обсуждение автономных агентных систем вроде Auto-GPT и BabyAGI , . Ведущий подкаста Крейг Смит отметил, что его собственный опыт работы с подобными агентами оказался несовершенным из-за регулярных сбоев и зацикливаний систем .

Паскаль Вайнбергер согласился с этой оценкой и объяснил фундаментальную проблему агентного подхода :

Чтобы решить эту проблему, в Bardeen AI разделили работу ИИ на два этапа:

  1. Build time (Этап сборки): Пользователь формулирует задачу на естественном языке, а LLM выступает в роли переводчика, трансформирующего его намерение в жесткий, структурированный скрипт автоматизации , .
  2. Run time (Этап исполнения): Готовый скрипт выполняется как классическая компьютерная программа — детерминированно, предсказуемо, без привлечения нейросетей на каждом шаге . Это позволяет легко отлаживать цепочки действий, избегать галлюцинаций и значительно снижать стоимость вычислений , .

Дополнительно Bardeen внедряет функции проактивной автоматизации. В режиме превью система способна анализировать повторяющиеся действия пользователя в браузере (например, копирование контактных данных из LinkedIn в Google Sheets) и самостоятельно предлагать автоматическое выполнение этого процесса , .

🏢 Борьба за рынок: как стартапам конкурировать с IT-гигантами 17:16

Крейг Смит поднял вопрос о выживании стартапов в условиях, когда технологические гиганты вроде Microsoft и Google активно внедряют функции ИИ в свои экосистемы, а OpenAI развивает собственную систему плагинов , , .

Вайнбергер убежден, что на рынке ИИ-решений формируется четкая четырехуровневая структура, в которой найдется место для игроков разного масштаба :

По мнению гостя, гиганты вроде Microsoft оптимизируют свои ИИ-копилоты под работу с отдельными документами (составление презентаций, редактирование текстов) в рамках закрытой корпоративной экосистемы , , . Стартапы же могут действовать быстрее и гибче, фокусируясь на пользовательском опыте и решении проблемы «50 открытых вкладок» , . Проекты вроде UIPath, как считает Вайнбергер, несут на себе груз устаревшей архитектуры, созданной 10 лет назад, тогда как новые стартапы проектируют свои системы с учетом генеративного ИИ в самом ядре , .

В ходе беседы Вайнбергер также высказал мнение, что текущая архитектура Transformer может оказаться не финальной точкой на пути к созданию сильного искусственного интеллекта (AGI) . Несмотря на то, что трансформеры идеально оптимизированы под параллельные вычисления на современных GPU-ускорителях , существует целый ряд альтернативных подходов, таких как капсульные сети Джеффри Хинтона или символьный ИИ (Symbolic AI), которые заслуживают масштабирования и глубокого изучения , .

🛡️ Риски, регуляция и глобальное будущее генеративного ИИ 50:50

Комментируя участившиеся в публичном пространстве заявления о рисках «экзистенциального вымирания человечества» из-за ИИ, Вайнбергер назвал эти дискуссии раздутыми и не слишком конструктивными , .

Для минимизации практических рисков злоупотребления технологиями автоматизации в Bardeen AI придерживаются строгих правил :

Паскаль Вайнбергер также высказался против идеи временного моратория на обучение крупных нейросетей, которая активно обсуждалась в ИТ-сообществе , . По его мнению, подобные запреты бессмысленны, поскольку разработки продолжатся в других юрисдикциях (например, в Китае или России), что лишь лишит западные компании конкурентных преимуществ .

Вместо этого Вайнбергер предлагает сфокусироваться на прорывных возможностях генеративного ИИ в медицине и науке . В качестве примера он привел проект своего близкого друга, использующего языковые модели для анализа сотен ежедневно публикуемых научных статей по протеомике человека , . ИИ помогает выявлять скрытые закономерности взаимодействия белков и агрегировать эти данные в единую модель, что значительно ускоряет тестирование новых лекарственных препаратов и планирование клинических испытаний .

💬 Цитаты

«Мы используем модели для этапа создания: переводим ваше намерение в код. Но исполняться он должен детерминированно.»

Паскаль Вайнбергер 47:19

«Остановка обучения моделей бесполезна — это лишь сделает вас аутсайдерами на фоне других стран.»

Паскаль Вайнбергер 55:09
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Оркестрационный слой (Orchestration Layer)
Инфраструктурный уровень ИИ, который координирует работу множества разрозненных приложений без участия человека.
Детерминированное исполнение (Deterministic Execution)
Процесс работы алгоритма, при котором одни и те же входные данные всегда дают абсолютно одинаковый и предсказуемый результат.
Протеомика (Proteomics)
Область биологии, изучающая структуру, функции и взаимодействия белков в живых организмах.
📊 Цифры
🗓 Хронология
  1. 2017 Публикация архитектуры Transformer, положившая начало современной эпохе генеративного ИИ.
  2. 2020 Создание первого прототипа Bardeen на базе ИИ-модели BERT в виде командной строки.
  3. 2022 Релиз ChatGPT, спровоцировавший глобальную перестройку ИИ-продуктов.
⚖️ Другая сторона
Искусственный интеллект Bardeen AI Паскаль Вайнбергер GPT-4 оркестрационный слой автоматизация процессов