Янник Килчер: «Отчет Стэнфорда о LAION-5B — это атака на open-source под видом защиты детей»

Yannic Kilcher 27,7 тыс. 33 мин 3 мин 23.12.2023
Главное

В конце 2023 года Стэнфордская обсерватория интернета (Stanford Internet Observatory) опубликовала отчет, в котором сообщила об обнаружении более тысячи изображений с признаками насилия над детьми (CSAM) в крупнейшем открытом наборе данных LAION-5B. Это событие вызвало волну публикаций в СМИ и привело к временному удалению датасета разработчиками. Популярный AI-исследователь и блогер Янник Килчер детально разобрал этот отчет, поставив под сомнение не сам факт проблемы, а методы исследования и истинные мотивы его авторов.

🚩 Скандал вокруг LAION-5B: манипуляция или борьба за этику? 0:01

Янник Килчер начинает разбор с признания важности проблемы: наличие незаконного контента в обучающих выборках — это серьезный вызов, требующий немедленного решения . Однако сам отчет Стэнфордского центра киберполитики вызывает у него скепсис. По мнению ведущего, публикация больше напоминает «заказной материал» (hit piece), направленный на дискредитацию open-source сообщества в сфере искусственного интеллекта .

Позиция Килчера основывается на нескольких ключевых тезисах:

🛠 Методология поиска: как Стэнфорд нашел иглу в стоге сена 14:40

В отчете описывается методика фильтрации данных LAION-5B (набора из 5 миллиардов пар «изображение-текст»), которая позволила выявить 1008 верифицированных случаев запрещенного контента .

Процесс включал несколько этапов:

  1. Первичный отсев: использование встроенного классификатора «небезопасного контента» (unsafe classifier) самого LAION .
  2. PhotoDNA: проверка изображений через систему Microsoft PhotoDNA, которая сопоставляет перцептивные хэши картинок с базами данных известных нарушений .
  3. Project Arachnid: передача подозрительных URL-адресов автоматизированной системе, которая затем передает их экспертам для окончательной верификации .
  4. Расширение поиска: использование векторных эмбеддингов для поиска визуально похожих изображений в окрестностях уже найденных нарушений (метод K-ближайших соседей или KNN) .

Килчер подчеркивает техническую иронию: исследователи использовали те самые инструменты (эмбеддинги и классификаторы LAION), которые они критикуют, чтобы доказать несовершенство датасета .

📉 Проблема масштаба и «нерфинг» моделей 10:25

Особое внимание в видео уделяется критике Stable Diffusion 1.5. В отчете Стэнфорда утверждается, что эта модель остается популярной именно из-за возможности генерации порнографии, в то время как версия 2.0 была «очищена» от такого контента .

Килчер категорически не согласен с такой трактовкой:

⚖️ Резонанс и выводы 21:41

В завершении отчета исследователи рекомендуют прекратить использование и распространение моделей, основанных на Stable Diffusion 1.5, если в них не применены жесткие фильтры безопасности .

Итоговая оценка Килчера:

Разработчики LAION уже удалили датасет для полной очистки, пообещав вернуть его после тщательной проверки . Таким образом, миссия исследователей была выполнена, но методы ее достижения оставили у экспертов индустрии горькое послевкусие.

💬 Цитаты

«1008 изображений такого материала — это на 1008 слишком много, вопрос о необходимости их удаления не стоит.»

Янник Килчер 02:56

«Это имеет все характеристики 'заказного материала' (hit piece), используемого для создания возмущения.»

Янник Килчер 03:36

«Если модель знает о дарк-материалах, это позволяет ей создавать лучшее искусство и понимать разницу между эпатажем и нормой.»

Янник Килчер 12:10
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
CSAM
Материалы, изображающие насилие над детьми или их эксплуатацию.
LAION-5B
Гигантский набор данных из 5.85 млрд пар изображений и текстов для обучения ИИ.
PhotoDNA
Технология Microsoft для идентификации незаконных изображений с помощью цифровых отпечатков.
Эмбеддинги
Числовые представления данных, позволяющие ИИ сравнивать схожесть объектов.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект LAION-5B Stable Diffusion Yannic Kilcher CSAM Open Source AI