Сандра Вахтер: «GDPR не защищает от того, что ИИ узнает о ваших болезнях без вашего ведома»

The TWIML AI Podcast 1,7 тыс. 51 мин 4 мин 23.09.2021
Главное

В новом эпизоде The TWIML AI Podcast ведущий обсудил с профессором Оксфорда Сандрой Вахтер критические точки соприкосновения искусственного интеллекта и правового поля. Основное внимание в беседе было уделено тому, как алгоритмические решения сталкиваются с пробелами в законодательстве о защите данных и принципах недискриминации.

🎓 Академический путь и фокус исследований 0:26

Сандра Вахтер (Sandra Wachter) — профессиональный юрист со степенью PhD и специализацией в области медицинского права . Её интерес к технологиям начался с медицинских устройств (Health Tech), которые наглядно демонстрируют пользу инноваций для общества . В дальнейшем её исследования расширились на все типы алгоритмических систем.

На текущий момент Сандра Вахтер выделяет три главных столпа своих исследований в области ИИ:

  1. Проблема «черного ящика» — отсутствие прозрачности в механизмах принятия решений.
  2. Защита данных — неспособность текущего законодательства (включая GDPR) справиться с аналитическими выводами ИИ.
  3. Предвзятость (Bias) — автоматизация и закрепление человеческих предубеждений в коде.

По мнению эксперта, эти проблемы универсальны: они возникают в любой стране (США, Европа, Новая Зеландия) и в любом секторе — от банковского дела до здравоохранения и тюремного надзора .

📦 Решение проблемы «черного ящика»: контрфактуальные объяснения 6:12

Сандра Вахтер отмечает, что часто компании не объясняют работу алгоритмов по двум причинам: либо они не хотят этого (защита коммерческой тайны), либо не могут (даже разработчики не всегда знают, почему нейросеть пришла к конкретному выводу) .

Вместо того чтобы требовать раскрытия полного исходного кода, которое бесполезно для обычного человека, Вахтер совместно с Брентом Миттельштадтом (Brent Mittelstadt) и Крисом Расселом (Chris Russell) предложила концепцию контрфактуальных объяснений (Counterfactual Explanations) .

Основные принципы этого подхода:

Этот метод был реализован в TensorFlow и Google Cloud, а также внедрен такими компаниями, как Vodafone .

🛡️ Право на обоснованные выводы (Inferences) 14:26

Одной из самых острых тем стала неадекватность современных законов о защите данных. Сандра Вахтер утверждает, что такие нормы, как GDPR, до сих пор опираются на концепцию «назойливого соседа» из XX века: они защищают личное пространство от прямого сбора данных (input), но игнорируют то, что ИИ может вычислить на выходе (output) .

Факты о возможностях современных алгоритмов:

По словам Вахтер, рекламодатели используют эти выводы для дискриминации. Например, в США алгоритмы исключали темнокожих пользователей из показов объявлений о работе или жилье . Проблема в том, что закон защищает процесс передачи данных (вы даете согласие на сбор информации о покупке мороженого), но не защищает от выводов, которые ИИ строит на этой основе (прогноз диабета через 10 лет) . Для детального обоснования этой проблемы Сандра написала работу объемом 150 страниц под названием «A Right to Reasonable Inferences» .

⚖️ Тестирование предвзятости: Тест CDD 30:28

Поскольку ИИ обучается на исторических данных, он неизбежно наследует человеческие предрассудки . Вахтер подчеркивает, что традиционное право не работает здесь, так как оно основано на интуиции судьи, а алгоритмы дискриминируют «за спиной» пользователя .

В ответ на это Сандра Вахтер разработала тест CDD (Conditional Demographic Disparity — Условное демографическое различие) .

Ключевые отличия методик:

  1. Сохраняющие предвзятость (Bias Preserving): 13 из 20 существующих тестов просто следят, чтобы уровень ошибок был одинаковым для всех групп . Они фиксируют текущее неравенство как статус-кво.
  2. Трансформирующие предвзятость (Bias Transforming): К ним относится CDD. Они стремятся к равенству результатов (Substantive Equality), что соответствует европейскому праву .

Тест CDD стал частью инструментария Amazon SageMaker Clarify в начале 2022 года . Он работает как система раннего оповещения, заставляя разработчиков обосновывать критерии. Например, если доход является прокси-переменной для расы или пола, разработчик должен доказать целесообразность его использования, несмотря на создаваемое неравенство .

🔮 Будущее регулирования в Европе 49:07

Сандра Вахтер считает, что эпоха простых этических деклараций (которых уже насчитывается более 150) прошла . Сейчас наступает этап жесткого регулирования. В фокусе её дальнейших исследований — грядущий EU AI Act, первая попытка создать всеобъемлющую правовую базу для ИИ .

Она планирует исследовать влияние этой регуляции на три ключевые области:

По словам профессора, ключевой задачей для общества остается открытая дискуссия о том, какой уровень неравенства допустим и какие критерии отбора считаются справедливыми в эпоху больших данных .

💬 Цитаты

«Самое пугающее в ИИ то, что он может узнать о людях информацию, которую они никогда не собирались раскрывать.»

Сандра Вахтер 04:26

«Если вы увольняете меня и даете мне в руки кусок кода вместо объяснений, я буду просто в ярости.»

Сандра Вахтер 10:30
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
GDPR
Европейский регламент по защите персональных данных.
Черный ящик ИИ
Ситуация, когда внутренние процессы принятия решения нейросетью непонятны человеку.
Контрфактуальное объяснение
Метод интерпретации ИИ, показывающий, какие минимальные изменения данных изменили бы результат на желаемый.
CDD
Математический тест для проверки алгоритмов на наличие дискриминации групп населения.
📊 Цифры
⚖️ Другая сторона
Право и общество Сандра Вахтер GDPR EU AI Act Amazon SageMaker Conditional Demographic Disparity