Бен Чжао о Nightshade: «Мы отравляем ИИ, чтобы защитить искусство»

The TWIML AI Podcast 3,1 тыс. 44 мин 2 мин 22.01.2024
Главное

🛡️ Битва за авторство: как Nightshade превращает ИИ-тренировку в «ядовитую таблетку» 30:14

В условиях, когда генеративные модели без спроса поглощают плоды многолетнего труда художников, исследователи ищут новые способы защиты интеллектуальной собственности. Профессор компьютерных наук Чикагского университета Бен Чжао (Ben Zhao) разработал инструмент Nightshade, который делает несанкционированное обучение ИИ крайне рискованным занятием. Этот «отравляющий» механизм призван изменить баланс сил, превращая бесконтрольный парсинг данных из бесплатного ресурса в дорогостоящую проблему для разработчиков моделей.

🎨 Экономическая драма: когда «кожа» художника становится промптом 10:59

Для современных концепт-художников и иллюстраторов стиль — это не просто эстетика, а основной инструмент заработка. По словам Бена Чжао, многие из них годами выстраивали уникальный визуальный язык, который служит их «визитной карточкой». Ситуация радикально изменилась с появлением генеративного ИИ:

По мнению Чжао, эта ситуация «переворачивает жизнь» профессионалов с ног на голову, заставляя даже признанных мастеров задумываться об уходе из профессии, например, в сферу работы водителем Uber.

🛠️ Инструментарий защиты: от Glaze до Nightshade 3:18

Исследовательская группа под руководством Бена Чжао последовательно создает инструменты для защиты прав человека в цифровую эпоху. Первым проектом стал Glaze, разработанный после общения с сотнями художников в Zoom.

Как утверждает Чжао, для того чтобы модель (например, Stable Diffusion XL) начала путать понятия — например, выдавать изображение кошки вместо собаки при соответствующем запросе, — достаточно внедрить в обучающую выборку всего от 20 до 50 отравленных образцов.

📈 Будущее обучения: лицензирование вместо «дикого» парсинга 37:14

Основная цель Nightshade — не просто «сломать» модели, а сделать практику «если это онлайн, значит, это мое» экономически невыгодной для крупных компаний.

  1. Повышение затрат: Необходимость фильтрации или «лечения» poisoned-данных существенно увеличивает стоимость разработки ИИ.
  2. Смена бизнес-модели: Разработчики будут вынуждены переключиться на использование лицензированного контента, за который художникам платят напрямую, как это принято в музыкальной индустрии.
  3. Корпоративный интерес: Бен Чжао отмечает неожиданный поворот — крупные компании с собственной интеллектуальной собственностью также проявляют интерес к таким инструментам, чтобы защитить свои активы от несанкционированного парсинга.

По мнению гостя подкаста, внедрение подобных технологий может стать новым способом принудительного соблюдения авторских прав на уровне самих данных.

💬 Цитаты

«Это буквально как ношение вашей кожи и присвоение вашей личности, чтобы делать то, что вы не только не контролируете, но иногда даже не осознаете.»

«Мы хотим сделать практику «если это в сети, значит, это мое» настолько дорогой, чтобы покупка лицензированного контента стала более экономически эффективной.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Отравление данных (Data Poisoning)
Атака на модель машинного обучения путем внесения изменений в обучающие данные, чтобы модель начала совершать специфические ошибки.
Белый ящик (White box)
Тип атаки, при котором атакующий обладает полным знанием внутренней архитектуры и параметров целевой модели.
Смещение признаков (Feature space distortion)
Математическое изменение данных, заставляющее модель ошибочно интерпретировать содержание изображения.
📊 Цифры
🗓 Хронология
  1. 2017 Публикация работы о введении в заблуждение людей через сгенерированные отзывы.
  2. 2020 Ранний проект по защите лиц от систем распознавания (прототип Glaze).
  3. 2021 Исследование по синтезу человеческой речи для имитации конкретных людей.
  4. 2023 Массовый интерес художников к защите искусства после появления инструментов типа DALL-E.
⚖️ Другая сторона
Искусственный интеллект Ben Zhao Nightshade Glaze Stable Diffusion Generative AI