# Маркес Браунли об изнанке генеративного ИИ и краже искусства

Источник: https://www.youtube.com/watch?v=0gNauGdOkro
Канал: Marques Brownlee
Опубликовано: 09.12.2022

---

Стремительное развитие генеративного искусственного интеллекта породило массу дискуссий о будущем творческих профессий и оригинального контента. В своем видеоролике популярный техноблогер Маркес Браунли анализирует возможности и скрытые угрозы таких нашумевших инструментов, как ChatGPT и DALL-E от компании OpenAI. Автор детально разбирает, способны ли алгоритмы полностью вытеснить человека из индустрии, и указывает на серьезные юридические и технические проблемы нейросетей.

## 🎭 Эксперимент со сценарием: когда нейросеть говорит за блогера
[[JUMP:0:00]]

В последнее время социальные сети заполонили продукты искусственного интеллекта: от цифровых аватаров и картин до продвинутых чат-ботов, способных поддерживать диалоги и писать стихи. На фоне этого бума закономерно возникает экзистенциальный вопрос: сможет ли ИИ со временем полностью заменить человека в творческой сфере?

Маркес Браунли решил начать свое видео с детального рассуждения о том, почему алгоритмы машинного обучения, несмотря на свои впечатляющие возможности, принципиально не способны вытеснить создателей контента. В этом вступлении утверждалось, что онлайн-творчество требует воображения и уникального человеческого взгляда, тогда как ИИ — это лишь инструмент для обработки данных. 

Однако в финале вводной части ведущий раскрыл карты: весь этот текст от первого до последнего слова был сгенерирован чат-ботом ChatGPT от компании OpenAI по запросу «написать сценарий для видео MKBHD». Сам блогер просто зачитал его перед камерой, наглядно продемонстрировав текущие возможности технологий.

## 🛠️ Инструмент, а не конкурент: реальный взгляд на ИИ
[[JUMP:2:14]]

Популярность нейросетей растет лавинообразно. Ранее Маркес Браунли уже разбирал возможности другого проекта OpenAI — нейросети DALL-E, которая способна создавать уникальные детализированные изображения высокого разрешения по текстовому запросу пользователя. Теперь же вирусным стал текстовый чат-бот ChatGPT, умеющий поддерживать осмысленный диалог практически на любую тему. 

Пользователи поручают ИИ все более сложные и комплексные задачи:

* Поиск фактов и создание кратких выжимок из книг.
* Написание стихотворений.
* Поиск ошибок в программном коде.
* Генерация полноценных сценариев для YouTube-роликов.

Несмотря на впечатляющую способность нейросети извлекать информацию из огромной базы человеческих знаний, Маркес Браунли предлагает прагматичный взгляд на технологию. По его мнению, ИИ в его текущем состоянии на 2022 год — это исключительно мощный инструмент, а не замена человеческому труду.

Браунли считает, что идеальный сценарий использования подобных систем для креаторов — это генерация идей и мозговой штурм на ранних этапах работы. Окончательное решение и «человеческий штрих» всегда должны оставаться за автором. 

Блогер сравнивает генеративный ИИ с уже привычными технологиями:

* Инструментом автоматического выделения объектов (Subject Selection) на базе ИИ в Photoshop, где пользователь все равно вручную дорабатывает края.
* Функцией интеллектуального повышения резкости (AI Sharpening) в Pixelmator, которая служит лишь основой для дальнейшей авторской обработки.

Главное отличие новых систем заключается в том, что они относятся к генеративному ИИ, то есть создают контент видимым образом «с нуля». Студенты могут использовать ChatGPT для поиска вдохновения при написании эссе, хотя выдать готовый качественный текст нейросеть пока не способна. К тому же, в сгенерированном для MKBHD сценарии присутствовало предупреждение, что текст является лишь отправной точкой; в нем отсутствовали фирменные аллитерации ведущего, а в полной версии содержались фактические ошибки.

## ❌ Проблема точности: почему роботы всё ещё врут
[[JUMP:5:23]]

Интеграция настолько масштабных технологий неизбежно сопряжена с рисками. Маркес Браунли выделяет две ключевые проблемы: высокий уровень ошибок (error rate) и сложность определения авторских прав.

Пытаясь протестировать ChatGPT, ведущий попросил систему написать обзор смартфона iPhone 14 Pro. Бот выдал связный текст с описанием характеристик, назвав экран ярким и отзывчивым, с чем Браунли согласился. Однако ИИ допустил грубые ошибки в аппаратной части:

* Камера: ChatGPT утверждал, что смартфон оснащен тремя модулями по 12 мегапикселей (ультраширокоугольным, широкоугольным и телеобъективом). В действительности же iPhone 14 Pro стал первой моделью в линейке Apple, получившей основной сенсор на 48 мегапикселей.
* Цветовая гамма: нейросеть перечислила цвета серебристый (silver), золотой (gold), графитовый (graphite) и «тихоокеанский синий» (pacific blue). Но этот набор принадлежал более старому iPhone 12 Pro, тогда как актуальная модель поставлялась в цвете «космический черный» (space black) и новом фиолетовом.

Еще более абсурдная ошибка произошла при ответе на простой вопрос: «Какое морское млекопитающее является самым быстрым на Земле?». ChatGPT ответил, что это сапсан (Peregrine Falcon), сразу же добавив, что он не является морским млекопитающим, но развивает скорость до 240 миль в час при пикировании. В качестве других «быстрых морских млекопитающих» система указала рыбу-парусника (sailfish), плавающую со скоростью 68 миль в час, и косатку (orca) со скоростью 34 мили в час. Из трех названных животных морским млекопитающим оказалась только косатка, хотя скорость ее была указана верно.

Маркес Браунли подчеркивает, что полагаться на стопроцентную фактическую точность ИИ пока нельзя. Схожая ситуация наблюдается и с визуальной нейросетью DALL-E, точность выполнения запросов которой блогер оценивает примерно в 90%. При этом парадокс заключается в том, что ИИ может легко ошибиться в простых вещах (например, изображении обычной кошки), но демонстрирует поразительные результаты при генерации сложных сюжетов вроде «кошка с реактивным ранцем прыгает через мужчину, поливающего сад в космосе». По мнению Браунли, со временем и развитием моделей уровень ошибок будет снижаться.

## 🎨 Конфликт правообладателей: как ИИ «копирует» чужие подписи
[[JUMP:8:24]]

Вторая серьезная проблема — этическая и юридическая сторона использования чужих работ. В социальных сетях активно обсуждается тезис о том, что ИИ «крадет искусство без согласия авторов». Поводом для новой волны споров стало взлетевшее на первое место в App Store приложение Lensa AI от Prisma Labs (а также его аналог Avatar AI). Пользователь платит несколько долларов, загружает свои фотографии, а алгоритм генерирует стилизованные аватары в различных образах.

При этом, как отмечает Браунли, если сами пользователи дают согласие на обработку своих лиц, то художники, чьи картины послужили базой для обучения ИИ, никакого согласия не давали. Нейросети копируют фоны, текстуры, линии и общую стилистику реальных авторов. Ярким доказательством этого стали искаженные, размытые элементы в углах готовых аватаров Lensa AI: алгоритм пытался воспроизвести авторские подписи, которые стояли на оригинальных картинах, использованных для обучения.

На сегодняшний день вопрос о том, как именно упоминать авторов оригинальных произведений, остается открытым. Одно дело — попросить DALL-E сгенерировать абстрактную кошку на основе стабильной диффузии (stable diffusion), обученной на миллиардах картинок из интернета. Совсем другое — задать запрос «кошка в стиле Клода Моне», где заимствование конкретного стиля становится очевидным.

С технической стороны сбор данных устроен через лазейки в законодательстве. Огромные массивы информации собираются некоммерческими организациями:

* Проект Common Crawl сканирует миллиарды веб-страниц и создает бесплатные публичные датасеты.
* На основе этих данных формируется общедоступная база LAION-5B, которую разработчики ИИ могут использовать бесплатно.

По мнению Маркеса Браунли, здесь кроется юридический парадокс: Common Crawl не извлекает прибыли из сбора данных, поэтому действует легально. Однако коммерческие компании вроде Prisma Labs или OpenAI затем используют эти бесплатные базы для создания платных продуктов, зарабатывая деньги на чужом контенте (например, за набор картинок в Lensa AI или доступ к генерациям OpenAI берут фиксированную плату).

Браунли приводит аналогию с музыкальной индустрией: блогер может использовать трек Тейлор Свифт в своем видео на YouTube, если отключит монетизацию. Но если кто-то другой попробует взять этот фрагмент и заработать на нем, звукозаписывающая компания UMG (Universal Music Group) мгновенно заблокирует контент. В сфере генеративного ИИ подобных правовых и культурных прецедентов пока просто не существует.

## 🧠 Переосмысление вдохновения: что ждет человеческое искусство
[[JUMP:12:51]]

Если на заре появления нейросетей ключевым вопросом было «что можно считать искусством», то сейчас, по мнению Браунли, гораздо интереснее разобраться в природе самого вдохновения.

Когда человек создает рисунок, это уникальное выражение его опыта. Художник вдохновляется всем, что видел в жизни до момента, когда перо коснулось бумаги. Искусственный интеллект, по сути, занимается «скоростным прохождением» вдохновения: он мгновенно пропускает через себя всю зафиксированную историю человечества, хранящуюся в базах данных. К слову, в датасете LAION-5B содержатся в том числе работы и превью видео (тамбнейлы) самого Маркеса Браунли.

Резюмируя, ведущий выражает надежду на то, что экспансия нейросетей в конечном итоге заставит человечество еще больше ценить подлинное искусство, созданное людьми. Тем не менее, обществу предстоит пристально следить за развитием правовых вопросов, а пока, как иронично отмечает Браунли, можно позволить «роботам репетировать их революцию».

В завершение Маркес Браунли упомянул спонсора выпуска — онлайн-инструмент для покупок Karma. Этот сервис помогает экономить деньги, сканируя интернет в поисках купонов, отслеживая цены на товары и предлагая кэшбек с возможностью вывода через PayPal.