Профессор права Криста Лазер: «Пиратство данных для ИИ — это не всегда Fair Use»

Wes Roth 11,5 тыс. 28 мин 4 мин 14.08.2025
Главное

Использование защищенных авторским правом данных для обучения искусственного интеллекта стало одной из самых горячих юридических тем последних лет. Ведущий канала Уэс Рот и профессор права Криста Лазер (Cleveland State University) обсуждают, почему технологические гиганты признаются в использовании пиратских библиотек, как суды интерпретируют концепцию «добросовестного использования» (fair use) и могут ли многомиллиардные штрафы стать экзистенциальной угрозой для таких компаний, как Anthropic и Meta.

⚖️ Фундамент спора: Добросовестное использование (Fair Use) 0:00

Большинство современных моделей ИИ обучаются на данных, защищенных авторским правом, включая книги, учебники и произведения искусства . По словам профессора Кристы Лазер, это происходит потому, что именно такие материалы содержат творческую выразительность, необходимую для генерации качественных и интересных ответов . Однако сам факт использования защищенных данных не всегда означает нарушение закона — ключевым вопросом здесь является доктрина «добросовестного использования» (fair use).

Криста Лазер выделяет четыре ключевых фактора, которые суды используют для анализа Fair Use:

Профессор отмечает, что в контексте ИИ суды часто признают обучение «трансформативным» процессом, так как модель создает принципиально новый опыт, отличный от простого чтения книги . Даже поглощение книги целиком может быть оправдано, так как для обучения качественной модели необходим полный контекст миллионов произведений .

🏴‍☠️ Пиратство как «плод отравленного дерева» 1:31

Одной из самых спорных тем является способ получения данных. Некоторые компании покупают лицензии или физические копии книг, но многие использовали торрент-сайты и пиратские библиотеки . В юридическом сообществе нет единого мнения о том, делает ли незаконный способ получения данных само обучение незаконным.

Криста Лазер описывает два противоположных судебных подхода:

  1. Позиция суда по делу Meta: Судья счел, что если конечное использование (обучение ИИ) является «добросовестным», то не имеет значения, были ли исходные данные получены из пиратских источников .
  2. Позиция суда по делу Barts против Anthropic: Суд разделил процесс на два этапа. Само пиратство (скачивание торрентов) признано незаконным актом, за который компания должна нести ответственность, независимо от того, насколько полезным оказался результат .

Лазер критикует подход судьи в деле Meta, считая его необоснованным . По её мнению, если разрешить пиратство при условии будущего «трансформативного использования», то любой пользователь сможет безнаказанно скачивать сериалы (например, Star Trek), заявляя, что делает это для обучения своего персонального ИИ-помощника . Она проводит аналогию с Робин Гудом: «Я могу украсть это, пока я это раздаю» .

📉 Теория «размывания рынка» в деле Meta 8:14

В деле против компании Meta (ныне признана экстремистской в РФ) суд выдвинул новую юридическую теорию — теорию «рыночного размывания» (market dilution theory) . По словам Кристы Лазер, суд предположил, что обучение ИИ может не быть «добросовестным использованием», если оно приводит к наводнению рынка ИИ-контентом, который вытесняет оригиналы .

Особенности этой теории:

🧠 ИИ против человека: В чём разница в процессе обучения? 10:40

Важным аргументом разработчиков ИИ является аналогия с человеческим мозгом: люди тоже читают книги, учатся на них и создают новое, не платя авторам за «обучение». Однако Лазер указывает на критическое юридическое различие: человек не создает цифровую копию произведения внутри своей головы в процессе чтения .

Профессор делится личной историей о своей матери, обладавшей фотографической памятью :

В случае с ИИ компании часто признают наличие «библиотек» — серверов, где хранятся полные копии данных для обучения . В то же время Google, по словам ведущего, защищается тем, что их поисковые роботы лишь индексируют сеть и создают «математическое представление» страниц, не сохраняя их копии . Лазер считает, что в судах предстоит детальная экспертиза того, как именно происходит токенизация и хранение данных у каждой конкретной компании .

💰 Миллиардные иски и экзистенциальная угроза для индустрии 24:57

Если суды признают компании виновными в нарушении авторских прав (особенно зарегистрированных), последствия могут быть катастрофическими. По закону США, за умышленное нарушение авторских прав на одно произведение может быть назначен штраф до $150 000 .

Масштаб проблемы:

Профессор прогнозирует, что эти дела дойдут до Верховного суда США, а процесс может затянуться на 5–10 лет . За это время компании, скорее всего, изменят свои практики и перейдут на использование только законно полученных данных .

💬 Цитаты

«Это похоже на Робин Гуда: я могу украсть это, пока я это раздаю.»

Криста Лазер 23:23

«Когда вы читаете книгу, вы не скачиваете копию в свой мозг.»

Криста Лазер 17:01
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Fair Use
Юридическая доктрина в США, допускающая ограниченное использование материалов в авторском праве без разрешения правообладателя.
Трансформативное использование
Создание на основе оригинала чего-то принципиально нового, имеющего другую цель или характер.
Токенизация
Процесс преобразования текста в числовые векторы для обработки нейросетью.
📊 Цифры
⚖️ Другая сторона
Право и общество Anthropic Meta OpenAI Fair Use Криста Лазер