Янник Килчер о рисках системы CSAM-детекции Apple: «Огромный потенциал злоупотреблений»

Yannic Kilcher 18,4 тыс. 50 мин 3 мин 16.08.2021
Главное

Технологический взгляд на CSAM-детекцию Apple: как работает NeuralHash и где скрыты риски 0:00

Янник Килчер, эксперт в области машинного обучения, проанализировал техническую документацию Apple по внедрению системы обнаружения материалов с сексуальным насилием над детьми (CSAM) в облачном сервисе iCloud. Основная задача системы — идентификация и сообщение о пользователях, хранящих известный противоправный контент, при попытке загрузки изображений в облако,. Несмотря на заявленные механизмы сохранения приватности, система вызывает серьезные споры из-за возможности обхода и потенциала для злоупотреблений,.

🛡 Архитектура системы: как Apple проверяет данные без прямого сканирования 2:15

Apple поставила перед собой задачу создать систему, которая выявляет запрещенный контент, не нарушая конфиденциальность обычных пользователей, чьи изображения не совпадают с базой данных CSAM. Ключевые требования к безопасности включают:

Килчер выражает скепсис по поводу последнего пункта: по его мнению, под давлением или при перегрузке системы компания может быстро заменить человеческий контроль автоматическими алгоритмами.

🧠 Нейронные сети и NeuralHash: как происходит идентификация 10:00

В основе детекции лежит технология NeuralHash — метод, который использует нейронные сети для создания «отпечатков» изображений. В отличие от стандартных криптографических хешей, где изменение даже одного бита полностью меняет результат, NeuralHash должен генерировать одинаковый хеш для визуально схожих изображений,.

Процесс выглядит следующим образом:

  1. Контрастивное обучение: С помощью сверточных нейронных сетей (CNN) система обучается тому, что различные версии одного и того же изображения (например, с разной яркостью или разрешением) должны иметь близкие векторы,.
  2. Locality Sensitive Hashing (LSH): Для дискретизации вектора используются случайные гиперплоскости, которые разбивают пространство на «корзины». Векторы, попавшие в одну область, считаются схожими.
  3. Итоговое хеширование: Полученные данные проходят через классические хеш-функции для уменьшения объема и обеспечения защиты от реконструкции изображения.

🔐 Криптографические методы защиты приватности 21:24

Чтобы Apple не могла видеть изображения пользователей, используются сложные криптографические протоколы:

⚠️ Уязвимости и риски злоупотреблений 38:33

Килчер выделяет два критических вектора опасности:

Риск со стороны базы данных

По мнению эксперта, главная опасность — контроль над базой данных CSAM. Если правительственный чиновник или злоумышленник получит доступ к наполнению базы, он сможет внести туда любое изображение. В результате любой пользователь, хранящий это изображение в iCloud, автоматически «засветится» для системы,.

Уязвимость к состязательным атакам (Adversarial Attacks)

Так как модель NeuralHash работает на устройстве пользователя, теоретически возможно использовать состязательные атаки — внесение минимальных изменений в пиксели, которые не видны человеку, но меняют выходной хеш. Это позволяет:

  1. Легко обходить систему: Злоумышленник может «перекинуть» свой запрещенный файл в «безопасную корзину».
  2. Подставлять других: Можно создать изображение, которое выглядит легитимным, но при обработке нейросетью попадает в хеш-корзину запрещенного материала, что позволит скомпрометировать любого человека.

В заключение Килчер отмечает, что, несмотря на «благие намерения» и качественную инженерную проработку, сама возможность существования такой системы расширяет полномочия компаний в отношении личных данных пользователей, что несет в себе системные риски.

💬 Цитаты

«Система может быть довольно легко обойдена. Если объединить это с тем, что мы внедряем механизм с потенциально гнусными последствиями, если кто-то недобросовестный получит над ним контроль, то это не сулит ничего хорошего.»

Янник Килчер 01:20

«Если я политическая партия, я просто вношу в базу данных то, что, как я знаю, есть только у оппозиции, и в ту же секунду их телефоны начинают светиться красным.»

Янник Килчер 41:47
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
CSAM
Материалы с сексуальным насилием над детьми (Child Sexual Abuse Material).
NeuralHash
Алгоритм на базе нейросетей, преобразующий изображение в короткую строку (хеш), которая идентифицирует визуально схожие изображения.
Locality Sensitive Hashing (LSH)
Метод хеширования, при котором близкие друг другу объекты отображаются в одни и те же «корзины» с высокой вероятностью.
Private Set Intersection (PSI)
Криптографический протокол, позволяющий двум сторонам сравнить наборы данных, не раскрывая их содержимое друг другу.
Adversarial Attack
Метод воздействия на нейросети путем внесения специально подобранных искажений, которые заставляют модель принимать неверные решения.
📊 Цифры
⚖️ Другая сторона
Технологии и IT Apple NeuralHash CSAM Detection Algorithm iCloud Machine Learning