Уилл Армис о «Проекте Панама» и пиратских библиотеках

The Verge 18,1 тыс. 1 ч 26 мин 2 мин 03.02.2026
Главное

AI и литература: «Проект Панама» и будущее авторских прав 4:44

В центре недавнего расследования издания The Washington Post оказался амбициозный проект компании Anthropic под названием «Проект Панама». Инициатива, запущенная на рубеже 2023 и 2024 годов, ставила своей целью масштабную оцифровку огромного количества книг для обучения моделей искусственного интеллекта, которые лежат в основе чат-бота Claude. Как утверждает журналист Уилл Армис, этот проект иллюстрирует скрытые методы, используемые технологическими гигантами для получения высококачественных данных, необходимых для создания «общего суперинтеллекта».

Методология: от пиратства к «гидравлическим ножам» 9:42

Согласно судебным документам, процесс накопления данных не всегда был легальным:

Армис отмечает, что компании Anthropic пришлось нанять Тома Тёрви — эксперта, который ранее руководил знаменитым проектом Google Books, чтобы наладить этот процесс. Однако, в отличие от Google, которая сканировала книги из библиотек бережно, Anthropic пошла по пути экономии времени, что привело к уничтожению физических копий.

Правовые дебаты о «добросовестном использовании» 17:56

Вопрос о том, является ли обучение нейросетей на книгах нарушением авторских прав, остается крайне спорным в юридической среде.

Теория «Первородного греха» AI 24:46

Ведущий Дэвид Пирс выдвигает гипотезу, что интенсивная общественная и правовая реакция на AI коренится в «первородном грехе» OpenAI. По его мнению, компания начала свою деятельность как академический проект, но при переходе к коммерческой модели не изменила свои методы сбора данных, вынудив конкурентов (Meta, Anthropic) действовать так же агрессивно, чтобы не проиграть «гонку вооружений».

Оба собеседника сошлись во мнении, что в индустрии царит атмосфера «морального парадокса»: многие руководители, включая Марка Цукерберга, искренне верят, что проигрыш в гонке AI — это экзистенциальный риск для человечества. В этой логике любые средства, включая нарушение авторских прав, оправданы «спасением мира».

💬 Цитаты

«Проект Панама был чем-то, что Anthropic начала с целью «деструктивно отсканировать все книги в мире».»

Уилл Армис 04:44

«Если мы должны были заплатить справедливую цену за все эти данные, индустрия AI вышла бы из бизнеса.»

Дэвид Пирс 24:19
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Добросовестное использование (fair use)
Правовое понятие, позволяющее использовать защищенные авторским правом материалы без согласия владельца в определенных целях, таких как трансформация данных.
Теневая библиотека (shadow library)
Нелегальные онлайн-хранилища, предоставляющие бесплатный доступ к защищенным авторским правом книгам и научным статьям.
Деструктивное сканирование
Процесс оцифровки книг, при котором для удобства автоматизированного сканирования удаляется переплет, что приводит к порче физического экземпляра.
📊 Цифры
🗓 Хронология
  1. 2019 Основатели Anthropic якобы скачали библиотеку LibGen во время работы в OpenAI.
  2. конец 2023 - начало 2024 Запуск Anthropic «Проекта Панама» по оцифровке книг.
  3. 2026 На текущий момент вопрос о легальности обучения AI на авторских книгах остается юридически нерешенным.
⚖️ Другая сторона
Искусственный интеллект Anthropic Claude OpenAI LibGen Project Panama