Ахмед Имтиаз: «Потребление собственного контента ведет ИИ-модели к безумию»

Eye on AI 1,5 тыс. 1 ч 4 мин 26.10.2023
Главное

В новом выпуске подкаста Eye on AI исследователь в области искусственного интеллекта и аспирант Университета Райса Ахмед Имтиаз (Ahmed Imtiaz) раскрывает механизмы возникновения «расстройства модельной аутофагии» (Model Autophagy Disorder, MAD). В беседе с ведущим Крейгом Смитом эксперт объясняет, почему обучение нейросетей на данных, созданных другими ИИ, ведет к деградации систем, как отличить «синтетику» в обучающих выборках и какую роль открытый исходный код играет в предотвращении экзистенциальных рисков ИИ.

🧬 Модельная аутофагия: когда ИИ начинает поедать себя 6:00

Главной темой обсуждения стала работа «Self-consuming generative models go MAD», в которой Ахмед Имтиаз и его коллеги исследовали эффект «самопоедания» генеративных моделей. Термин MAD (Model Autophagy Disorder) является прямой отсылкой к медицине и биологии. По словам Имтиаза, название вдохновлено «коровьим бешенством» (губчатая энцефалопатия), которое распространялось, когда скот кормили останками других животных .

В контексте ИИ аутофагия (самопоедание) — это процесс, при котором генеративные модели обучаются на данных, синтезированных предыдущими поколениями ИИ. Это создает петлю обратной связи, которая приводит к двум основным негативным последствиям:

Имтиаз подчеркивает, что это не теоретическая проблема далекого будущего — деградация становится заметной всего через 10–11 циклов самообучения в контролируемых условиях .

🖼️ Визуальные и текстовые симптомы «бешенства» нейросетей 12:46

Исследователи обнаружили, что разные типы моделей демонстрируют специфические «симптомы» MAD. По мнению Имтиаза, артефакты напрямую зависят от архитектуры алгоритма:

  1. StyleGAN (GAN-сети): При самопотреблении данных начинают генерировать изображения с характерной «перекрестной штриховкой» (cross-hatching) .
  2. Диффузионные модели (например, Stable Diffusion): Склонны к появлению артефактов размытия .
  3. LLM (языковые модели): Теряют семантическое значение и качество текста, становясь излишне формальными или бессмысленными .

Имтиаз проводит четкую грань между синтетическими данными, созданными физическими движками (например, 3D-рендеринг городов), и данными, синтезированными ИИ . В первом случае петля обратной связи обычно отсутствует, так как изображения не используются для переобучения самого движка рендеринга. Проблема MAD касается именно тех случаев, когда ИИ-модель обучается на продуктах деятельности своего «вида».

🌐 Проблема «отравленного» интернета 15:38

Одной из самых больших загадок остается объем синтетических данных в открытом доступе. Имтиаз признает, что точных цифр пока нет, так как детекторы дипфейков несовершенны . Однако он утверждает, что ИИ-контент уже присутствует в крупнейших открытых датасетах.

Имтиаз считает, что компании скоро могут столкнуться с «дефицитом данных». Если интернет будет заполнен синтетикой на 90%, найти «чистые» человеческие данные для обучения новых поколений ИИ станет крайне дорого и сложно .

🛡️ Стратегии выживания: свежие данные и водяные знаки 35:32

Для предотвращения MAD Имтиаз предлагает несколько стратегий:

  1. Постоянный приток свежих реальных данных: По мнению гостя, даже небольшая доля новых человеческих данных в каждом цикле обучения способна значительно отсрочить или полностью нейтрализовать эффект деградации .
  2. Цифровые водяные знаки (Watermarking): Технологии вроде SynID от Google позволяют внедрять в изображения невидимые метки .
  3. Аутофагия-ориентированные водяные знаки: Имтиаз считает необходимым разработать систему, которая не только детектирует ИИ-контент, но и позволяет бесследно удалять водяной знак перед обучением, чтобы внедренный шум не усиливал артефакты при самообучении .

🔓 Открытый код как предохранитель апокалипсиса 47:52

В дискуссии о безопасности ИИ Имтиаз занимает сторону сторонников Open Source. Он ссылается на мнение профессора Стэнфорда Дэвида Донохо (David Donoho), который выделяет три столпа прогресса (и безопасности) ИИ:

Имтиаз не согласен с позицией Джеффа Хинтона или Джошуа Бенджио о том, что мощные модели нельзя открывать из-за риска создания оружия . По мнению Имтиаза, «закрытость» моделей ограничивает количество людей, способных исследовать их предвзятость (bias) и интерпретировать их работу .

Гость полагает, что в человеческом обществе действует закон больших чисел: большинство людей будут использовать открытые инструменты во благо, а злонамеренные «хвосты» распределения должны сдерживаться правоохранительными органами . «Мода человеческого поведения направлена на добро, так как нам нужно сотрудничать, чтобы выжить», — утверждает исследователь .

🇧🇩 Bengali AI: борьба за языковую доступность 3:52

Помимо работы в Google и Университете Райса, Имтиаз развивает некоммерческий проект Bengali AI. Проблема заключается в том, что бенгальский язык (один из самых распространенных в мире) плохо представлен в обучающих выборках западных корпораций.

💬 Цитаты

«Термин MAD (Model Autophagy Disorder) очень сильно вдохновлен коровьим бешенством.»

Ахмед Имтиаз 29:48

«Когда вы открываете исходный код, у вас теоретически есть бесконечное количество голов, работающих над проблемой.»

Ахмед Имтиаз 53:03

«Мода человеческого поведения направлена на добро, так как нам нужно сотрудничать, чтобы выжить.»

Ахмед Имтиаз 56:09
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Model Autophagy Disorder (MAD)
Состояние деградации генеративных моделей ИИ, вызванное обучением на данных, которые были созданы самими моделями.
Long Tail (Длинный хвост)
Редкие, уникальные примеры данных в распределении, которые первыми исчезают при деградации модели.
Watermarking
Процесс внедрения невидимых идентификационных меток в контент для определения его происхождения (человек или ИИ).
📊 Цифры
🗓 Хронология
  1. 2021 Ориентировочная дата отсечки данных для многих популярных моделей ИИ.
  2. 2023 Публикация статьи исследователя Дэвида Донохо об ускорении прогресса в ИИ.
⚖️ Другая сторона
Искусственный интеллект Model Autophagy Disorder MAD LLM Bengali AI Stable Diffusion