Как Reddit, ИИ-Дрейк и кража интеллектуальной собственности меняют экономику

Prof G 5,4 тыс. 23 мин 5 мин 26.04.2023
Главное

Компании Reddit и Twitter переходят на платную модель доступа к своим API, что кардинально меняет правила игры для создателей искусственного интеллекта. В рамках подкаста Prof G Markets ведущий Проф Джи и его коллега Эд обсуждают неизбежность краха бесплатного использования данных, уроки музыкальной индустрии и будущее Уолл-стрит в эпоху ИИ. Этот разбор демонстрирует, как защита интеллектуальной собственности сталкивается с технологическим прогрессом.

🔌 Конец эпохи бесплатных данных: Reddit и Twitter закрывают шлюзы 0:00

Социальная платформа Reddit объявила о намерении взимать плату с компаний за доступ к своему API (интерфейсу прикладного программирования). Этот шаг повлечет за собой серьезные последствия для ИИ-гигантов, таких как Google и OpenAI, которые используют массив обсуждений Reddit для обучения своих алгоритмов. На данный момент Reddit активно готовится к выходу на IPO, и хотя основной доход компании по-прежнему формируется за счет рекламы, монетизация данных станет новым важным направлением.

Reddit не одинок в этой инициативе: ранее аналогичные меры по ограничению бесплатного API предприняла компания Twitter. Программы генеративного ИИ, включая ChatGPT и Stable Diffusion, достигли нынешней мощности именно благодаря возможности бесплатно собирать практически весь массив данных в интернете. Теперь же технологические компании прямо заявляют, что их контент больше не будет бесплатным.

🎵 Лицензирование по модели Мадонны: как ИИ должен платить создателям 1:06

По мнению Проф Джи, разработчики больших языковых моделей (LLM) обязаны заключить лицензионные соглашения с правообладателями, если они используют чужие данные для обучения своих коммерческих продуктов. Ведущий сравнивает эту ситуацию с музыкальной индустрией: когда радиостанция ставит трек Мадонны, специальная группа по защите прав рассчитывает стоимость и направляет артисту или лейблу положенные выплаты, удерживая лишь 10% комиссии.

В качестве примера из личной практики Проф Джи вспоминает свой опыт работы в совете директоров газеты The New York Times. Он утверждает, что еще на раннем этапе предлагал заблокировать поисковых роботов Google, объединиться с другими крупными издательскими домами (старыми игроками вроде Condé Nast и News Corp) и создать единый пул данных для продажи корпорации Microsoft, развивавшей поисковик Bing. По словам Проф Джи, этот план провалился по двум причинам:

Проф Джи считает, что сейчас создатели контента — от фотобанков вроде Getty Images до текстовых платформ — должны выступить единым фронтом против ИИ-сообщества. В качестве примера легального подхода он приводит компанию Adobe, которая обучает свою генеративную модель на собственном или лицензированном контенте, гарантируя пользователям защиту от судебных исков по авторским правам. По прогнозу Проф Джи, рынок ИИ-лицензирования будет развиваться по модели стриминга: топовые авторы получат львиную долю выплат, а длинному хвосту менее популярных создателей достанутся копейки.

🎤 ИИ-Дрейк и экономика пользовательского контента 4:49

Громким прецедентом в сфере защиты авторских прав стал ИИ-трек, имитирующий голоса музыкантов Дрейка и The Weekend. До того как медиагигант Universal Music Group (UMG) добился удаления песни, она успела набрать более 600 000 стримов на платформе Spotify всего за несколько дней. Сейчас UMG жестко требует от стриминговых платформ заблокировать ИИ-системам доступ к скрейпингу их музыкальных каталогов.

Однако Эд поднимает более сложный вопрос: как быть с контентом обычных пользователей, которые пишут посты на Reddit или общаются с друзьями, не преследуя коммерческих целей? Проф Джи полагает, что рядовые пользователи не имеют права на выплаты и не перестанут публиковать посты. По его мнению, в данном случае уже произошел «обмен ценностями»: пользователь получает платформу для диалога, репутацию или охваты, а Reddit берет на себя расходы по созданию сети и инфраструктуры, поэтому именно платформа имеет право на компенсацию от ИИ-компаний.

Попытки использовать блокчейн для распределения рекламных доходов между миллионами пользователей Проф Джи называет «логистическим и трекинговым кошмаром». Дрейк создает музыку ради прямой монетизации и тратит на это миллионы, тогда как обычный блогер на платформах вроде Medium, Quora или Discord преследует иные цели (строительство личного бренда или влияние). В крайнем случае, как считает ведущий, ИИ-модели могут указывать авторов в виде текстовых сносок, аналогично источникам в академических книгах.

🇨🇳 Шаньчжай против капитализма: экономика кражи IP и уроки истории 8:36

Эд проводит аналогию между текущей экспансией ИИ и спецификой китайской экономики. В Китае исторически слабые законы об интеллектуальной собственности породили феномен «шаньчжай» (shanzai) — культуру легального копирования потребительских товаров, софта и брендов. По мнению Эда, это позволило Китаю высвободить колоссальную силу масштабирования, но если США не ужесточат регулирование ИИ, страна рискует превратиться в «нацию шаньчжай», где оригинальные авторы лишатся стимулов к созданию нового.

Проф Джи дополняет этот тезис историческим контекстом, напоминая, что в XVIII и XIX веках сами США активно занимались промышленным шпионажем и кражей IP в Европе. Американцы буквально похищали ремесленников и копировали текстильные технологии для строительства своих фабрик на Восточном побережье. По словам ведущего, любая развивающаяся экономика (будь то современный Вьетнам, Индия или Китай) начинает как низкозатратный производитель, заимствующий чужие идеи, и лишь со временем эволюционирует в ремесленную экономику с жесткой защитой собственных патентов.

Ярким примером баланса защиты IP Проф Джи называет фармацевтическую индустрию:

📈 ИИ на Уолл-стрит: конец эпохи традиционных аналитиков? 18:26

В финальной части дискуссии Эд приводит данные двух свежих научных исследований возможностей ChatGPT:

  1. В работе «Может ли ChatGPT расшифровать язык ФРС?» доказано, что ИИ успешно определяет характер заявлений Центробанка (жесткий или мягкий).
  2. В исследовании «Может ли ChatGPT прогнозировать движение цен на акции?» подтвердилось, что анализ новостных заголовков роботом позволяет точно предсказывать динамику котировок.

Проф Джи утверждает, что финансовым аналитикам Уолл-стрит стоило беспокоиться за свои рабочие места еще 20 лет назад. В то время регуляторы законодательно разделили инвестиционно-банковский бизнес и независимую аналитику после крупных скандалов (когда аналитики Salomon Brothers умышленно завышали рейтинги компаниям ради получения их инвестиционных контрактов). Лишившись притока денег от инвестбанкинга, аналитические отделы стали нерентабельными и попали под массовые сокращения.

Тем не менее, на рынке фондов начинается новая технологическая гонка вооружений. По словам Проф Джи, миллиардер Кен Гриффин вкладывает сотни миллионов долларов в интеграцию ИИ. Подобно тому, как математик Джеймс Саймонс из Renaissance фонда совершил революцию в квантовом трейдинге, сейчас формируется новый класс управляющих хедж-фондов, которые будут извлекать сверхдоходы (альфу) с помощью генеративных ИИ-моделей.

В качестве карьерного совета молодым специалистам Проф Джи рекомендует становиться экспертами по внедрению ИИ-инструментов в конкретных прикладных сферах, таких как привлечение клиентов или локализация контента. Напоследок ведущий раскритиковал Илона Маска и других сторонников теории «ИИ — машина Судного дня», заявив, что их призывы поставить технологии на паузу продиктованы исключительно желанием выиграть время и догнать конкурентов.

💬 Цитаты

«Если ИИ-модели используют наши данные для генерации контента на выходе, они технически должны нам денег.»

«Если ваша экономика растет быстрее чем на 8% в год, значит, вы занимаетесь кражей интеллектуальной собственности.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
API
Интерфейс прикладного программирования, с помощью которого внешние программы могут скачивать и обрабатывать данные платформы.
Шаньчжай (Shanzai)
Китайский термин, описывающий субкультуру и экономику копирования известных брендов и технологий на массовом уровне.
Квантовый трейдинг
Стратегия алгоритмической торговли на бирже, основанная на сложных математических и статистических моделях.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Reddit OpenAI Universal Music Group ChatGPT