Маркес Браунли представил собственную теорию уровней обмана ИИ

Технологии генеративного искусственного интеллекта развиваются стремительными темпами, заставляя человечество переосмыслить границы цифрового творчества. В своём новом видео популярный технологический блогер Маркес Браунли делится оригинальной теорией двух уровней развития ИИ, анализируя влияние сгенерированного контента на наше восприятие реальности. Главным примером пугающей точности технологий стал трек, в котором звучит неотличимый от настоящего голос рэпера Jay-Z.

🧠 Теория двух уровней обмана ИИ 0:01

По мнению Маркеса Браунли, наиболее впечатляющая черта искусственного интеллекта заключается в том, что по мере своего развития он всё больше напоминает человеческий разум. В некоторых случаях современные технологии уже способны успешно проходить тесты, решать сложные задачи, находить скрытые паттерны и имитировать различные аспекты человеческой деятельности. Браунли отмечает, что системы ИИ, превосходящие человека в узких задачах, существуют достаточно давно. В качестве общеизвестного примера он приводит алгоритмы, способные анализировать огромные массивы данных и диагностировать заболевания на самых ранних стадиях точнее, чем это делают квалифицированные врачи.

Однако качественный сдвиг, по словам ведущего, произошел с появлением генеративного ИИ. Когда алгоритмам поручают творческие задачи — создание уникальных текстов, изображений или звуков на основе масштабных наборов данных, — это начинает выглядеть по-настоящему пугающе. На основе этих наблюдений Браунли сформулировал собственную теорию, разделяющую успех продвинутого ИИ на два принципиальных уровня.

🧥 Феномен первого уровня: иллюзия невнимательности 1:19

Первый уровень успеха генеративного контента, согласно теории Браунли, достигается тогда, когда ИИ обманывает человека исключительно из-за его невнимательности. В таких ситуациях пользователи интернета не ищут подвоха целенаправленно. Автор видео приводит личный пример: резонансную фотографию Папы Римского в стильном пуховике, которую он просто пролистал в своей ленте соцсетей, посчитав забавным, но вполне реальным кадром.

Критический взгляд включается только тогда, когда пользователю прямо сообщают, что изображение создано нейросетью. По словам Браунли, в этот момент активируется так называемый «скептический глаз», и несовершенства технологии становятся очевидными:

Анатомические ошибки (например, странно выглядящие пальцы рук).
Искажения и размытия мелких деталей на заднем фоне.
Общая неестественность композиции при детальном рассмотрении.

Ведущий добавляет, что к первому уровню относятся и многие другие вирусные фейки, вроде поддельных кадров задержания Дональда Трампа. Аналогичный принцип работает и в текстовой сфере: чат-боты вроде ChatGPT, Bard или Bing могут написать весьма искреннее электронное письмо. Получатель прочтет его и не заметит подвоха, поскольку это обычная рутинная переписка с низкими ставками, где никто не ожидает манипуляций со стороны алгоритмов.

🎤 Глубокое погружение во второй уровень: виртуальный Jay-Z 2:12

Настоящий страх, по мнению Браунли, вызывает второй уровень развития ИИ. Он наступает тогда, когда человек заранее знает, что перед ним продукт работы нейросети, но технологии всё равно удаётся обмануть его восприятие. В качестве яркого доказательства ведущий приводит случай из личной практики, когда он получил электронное письмо от артиста по имени Джей Мадерос. Музыкант поделился демо-записью своего нового трека, который был оформлен как совместная работа с легендарным рэпером Jay-Z. При этом голос Jay-Z был полностью смоделирован искусственным интеллектом.

Маркес Браунли признаётся, что звучание сгенерированного голоса показалось ему абсолютно абсурдным по степени своей точности. Даже осознавая искусственную природу аудиозаписи, слушатель ловит себя на мысли, что он искренне наслаждается исполнением, как если бы это были настоящие куплеты от Jay-Z.

Вместе с тем автор видео раскрывает важные технические подробности создания этого трека со слов Джейми Джонса. Процесс не был простой минутной задачей:

Текст куплетов был полностью написан человеком ещё до того, как ИИ-инструменты стали общедоступными.
Доступный софт не являлся идеальным решением из коробки.
Создателям пришлось накладывать множество звуковых слоёв, экспериментировать с различными методами и вручную дорабатывать произношение.

Особую сложность вызвали слова с созвучными окончаниями (такие как feeling, ceiling и appealing). Нейросеть изначально произносила их с едва заметными стилистическими отличиями, что ломало общую рифму. Авторам пришлось перезапускать генерацию аудиозаписи огромное количество раз, чтобы добиться идеального попадания в образ артиста. Браунли резюмирует, что именно этот высокий финальный результат открывает настоящий «ящик Пандоры», ведь человек начинает получать удовольствие от творчества, зная, что за ним стоит машина.

🔮 Будущее генеративных технологий и поиски противодействия 4:24

Главная тревожная мысль, которую озвучивает Маркес Браунли, заключается в том, что текущее состояние генеративных технологий — это их абсолютно худшая форма, которую мы когда-либо увидим в будущем, ведь они будут только развиваться. Конечная цель разработчиков всех этих систем — полноценный переход на второй уровень.

Браунли прогнозирует ключевые векторы развития индустрии:

Разработчики чат-ботов стремятся к тому, чтобы их алгоритмы могли на равных проходить проверку в живом диалоге с человеком.
Создатели генераторов изображений работают над тем, чтобы выдавать полноценные, применимые на практике картины и рисунки, неотличимые от человеческих.
Инженеры беспилотных автомобилей обучают машины предсказуемо и безопасно двигаться по дорогам общего пользования бок о бок с водителями-людьми.

Отвечая на вопрос о наличии глобального решения для защиты от потенциальных угроз ИИ, ведущий констатирует, что на текущий момент его просто не существует из-за новизны технологии. Некоторые эксперты предлагают внедрять жесткое государственное регулирование или полностью запрещать подобные разработки, однако сам Браунли заявляет, что не верит в эффективность запретительных мер. По его мнению, единственным реалистичным сценарием станет параллельное развитие специализированных инструментов детекции ИИ-контента. Человечеству придётся научиться своевременно развёртывать и применять эти защитные системы, когда возникнет обоснованная необходимость проверить подлинность информации. А пока этого не произошло, блогер предлагает иронично наслаждаться эпохой первого уровня, которая продлится уже не очень долго.