Майкл Кернс: «Галлюцинации ИИ — это цена его универсальности»

The TWIML AI Podcast 589 39 мин 4 мин 21.12.2023
Главное

Профессор Пенсильванского университета и исследователь Amazon Майкл Кернс (Michael Kearns) возвращается на подкаст TWIML AI, чтобы обсудить сейсмические сдвиги в области ответственного ИИ (Responsible AI). За прошедший год индустрия перешла от предсказательных моделей к генеративным, что породило новые вызовы — от галлюцинаций и токсичности до проблем защиты интеллектуальной собственности.

🌀 Новая эра: от классификации к генерации 0:52

За последний год ландшафт искусственного интеллекта изменился до неузнаваемости. По мнению Майкла Кернса, главная сила современных генеративных моделей заключается в их открытости (open-endedness). Однако именно эта черта становится основным источником проблем для обеспечения безопасности .

В отличие от «старых» моделей, которые решали конкретные задачи (например, предсказание выплаты кредита по анкете), генеративные системы работают с неструктурированными данными. Кернс подчеркивает ключевые отличия:

📋 Сервисные карты (Service Cards) и прозрачность 1:31

Проект сервисных карт Amazon, представленный годом ранее, превратился в «хорошо отлаженный механизм» . Эти документы служат краткими руководствами для пользователей, описывая назначение моделей, рекомендуемые сценарии использования и метрики ответственного ИИ.

Майкл Кернс признает, что сервисные карты — это лишь «верхушка айсберга» . Под капотом находится огромный пласт количественного анализа, но не всё поддается оцифровке. Кернс утверждает, что индустрия и наука пока не выработали надежных способов измерения таких вещей, как «присвоение стиля» автора языковой моделью . В таких случаях разработчикам приходится полагаться на качественные оценки и рекомендации.

📏 Проблема оценки LLM и бенчмарки 5:41

Одним из главных анонсов конференции AWS re:Invent стала новая функция оценки моделей в сервисах Bedrock и SageMaker. Она позволяет клиентам сравнивать модели, используя в том числе стандарт Helm (Stanford University), который постепенно становится индустриальным эталоном .

Кернс выделяет несколько фундаментальных сложностей в оценке LLM:

  1. Субъективность: В генерации текста часто нет «правильного» ответа.
  2. Зависимость от контекста: Галлюцинация в журналистике — это критическая ошибка, но в исторической беллетристике она может быть допустимым художественным вымыслом .
  3. Избыточность метрик: Исследователи рискуют «утонуть в море цифр», когда разные метрики измеряют фактически одно и то же .

По мнению гостя, со временем индустрия перейдет от общих бенчмарков к метрикам для конкретных сценариев использования, что позволит точнее настраивать модели под нужды бизнеса .

🛡️ Борьба с галлюцинациями: стражи и архитектура 15:57

Сегодня основным методом борьбы с галлюцинациями является RAG (Retrieval-Augmented Generation — генерация с расширенным поиском). Однако Кернс называет текущие методы защиты, такие как «модели-гарды» (guardrail models), своего рода «пластырями» .

В сообществе безопасности существует термин «Bolton security» — когда система строится уязвимой, а патчи накладываются постфактум. Кернс считает, что ИИ сейчас находится на этой стадии. Его видение будущего заключается в «эндогенизации» ограничений:

🔒 Приватность и «чистые комнаты» (Clean Rooms) 27:34

Майкл Кернс подробнее остановился на запуске сервиса Clean Rooms ML с поддержкой дифференциальной приватности (Differential Privacy, DP). Это технология, которую Кернс изучал совместно с экспертом Аароном Ротом (Aaron Roth) .

Суть технологии в Clean Rooms:

  1. Владелец данных предоставляет доступ к датасету в изолированной среде.
  2. При запросах (например, о проценте игроков в видеоигры в возрасте от 19 до 35 лет) система добавляет в ответ математически выверенный «шум» .
  3. Этот шум делает невозможным обратный инжиниринг данных для идентификации конкретного человека, но сохраняет статистическую точность для бизнеса .

«Священным Граалем» науки Кернс называет создание синтетических датасетов с полной дифференциальной приватностью, которые позволяли бы проводить любые эксперименты машинного обучения с тем же результатом, что и на реальных данных, без малейшего риска утечки личной информации .

🌿 Ответственный ИИ «в дикой природе» 33:56

В недавней статье «Responsible AI in the wild», написанной в соавторстве с Аароном Ротом, Кернс резюмирует уроки работы в AWS за последние три с половиной года. Один из главных выводов: привычные академические подходы часто пасуют перед реальностью .

В завершение Майкл Кернс признается, что, несмотря на 40-летний стаж в науке, он чувствует некоторое пресыщение от хайпа вокруг ChatGPT на каждом семейном ужине, но считает текущий момент невероятно захватывающим временем для технологий .

💬 Цитаты

«В науке это трюизм: за универсальность всегда приходится платить.»

Майкл Кернс 15:06

«То, что в одном случае является галлюцинацией, в другом может быть желаемым обобщением.»

Майкл Кернс 12:28

«Я мечтаю сходить на ужин, где темой разговора не будет ChatGPT.»

Майкл Кернс 38:55
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RAG
Метод, при котором модель находит информацию в надежных внешних источниках перед ответом.
Дифференциальная приватность
Математический метод добавления шума в данные, позволяющий скрыть информацию об индивидах при сохранении общей статистики.
LLM
Большие языковые модели, обученные на огромных массивах текста.
RLHF
Метод обучения модели на основе предпочтений и оценок, выставленных живыми людьми.
📊 Цифры
🗓 Хронология
  1. 2022 Анонс первых сервисных карт (Service Cards) на конференции re:Invent.
  2. 2023 Запуск сервиса оценки моделей и интеграция дифференциальной приватности в Clean Rooms.
⚖️ Другая сторона
Искусственный интеллект Michael Kearns AWS Responsible AI LLM Differential Privacy