Эксперимент WIRED: искусственный интеллект примерил роли от врача до пожарного

Журналисты издания WIRED провели масштабный эксперимент, в котором представители 20 различных профессий — от врачей и юристов до комиков и пожарных — протестировали возможности искусственного интеллекта в своей повседневной работе. Участники исследования оценили, способны ли современные алгоритмы генерировать качественный код, ставить диагнозы, писать сценарии и создавать кулинарные шедевры. Результаты эксперимента наглядно демонстрируют текущие границы применимости нейросетей и те сферы, где человеческий фактор всё ещё остаётся незаменимым.

💻 Программирование и работа с текстом: от сырого кода до бездушных обзоров 0:12

Программист решил проверить возможности нейросети, задав ей задачу разработать сайт для поиска крафтового пива поблизости с использованием HTML, CSS и Flask. По его словам, искусственный интеллект сгенерировал работающий сырой код. После копирования и вставки данных в отдельные файлы специалист получил функционирующий веб-ресурс, включающий бэкенд, фронтенд и стилизацию. Как отметил инженер, способность алгоритма создавать человекочитаемый и понятный код, формирующий полноценный сайт, выглядит как колоссальное достижение.

В то же время в сфере профессиональной журналистики результаты оказались менее впечатляющими. Редактор обзоров журнала WIRED протестировал ChatGPT, попросив его написать рецензию на электроскейтборд в фирменном стиле автора на основе его же прошлых публикаций. ИИ успешно извлёк технические характеристики прибора, включая моторы мощностью 3000 Вт и скорость до 26 миль в час. Однако, по мнению журналиста, текст получился скучным и лишенным индивидуальности, напоминая обычный пресс-релиз. Эксперт подчеркнул, что ИИ физически не способен протестировать продукт, поэтому доверять такому источнику информации нельзя.

Схожие проблемы возникли и у копирайтера, заказавшего рекламные слоганы для вымышленной веганской кампании McDonald's. Нейросеть предложила несколько вариантов рекламных лозунгов:

«Веганизируйте свои вкусовые рецепторы сегодня» — по мнению специалиста, это напоминает речь продавца подержанных автомобилей;
«Ни одно животное не пострадало, только вкус улучшился» — копирайтер отметил, что никто не ходит в фастфуд ради искусственного «улучшения вкуса»;
«Пора стать зелёными» — крайне короткий, банальный и незавершённый слоган.

По мнению автора, ИИ может помочь в качестве инструмента для мозгового штурма, но выдаваемый им продукт без глубокой доработки остаётся низкокачественным.

Сценарист, в свою очередь, предложил нейросети написать сцену из 1949 года, где три вдовы Второй мировой войны провозглашают тост на свадьбе своей младшей сестры Руби. Алгоритм выдал слишком буквальные диалоги, где персонажи прямо проговаривали сюжетные задачи, и перенасытил текст ремарками, вторгаясь в зону ответственности режиссёра. По мнению сценариста, ИИ полезен для концептуального брэйншторма, когда автор зашёл в тупик, но полноценно заменить человека он не может.

🩺 Точные науки и экспертиза: медицина, право и психология 0:52

Врач предложил ИИ смоделировать запрос реального пациента с симптомами лихорадки, сыпи и боли в теле, уточнив, не являются ли высыпания на гениталиях признаком оспы обезьян. Нейросеть выдала довольно убедительный ответ, указав, что при оспе обезьян сыпь на гениталиях не является ведущим симптомом, а подобные проявления скорее указывают на инфекцию, передающуюся половым путём (ИППП). Тем не менее, по мнению доктора, остальная часть ответа состояла из банальных советов обратиться к врачу, а текущий уровень ИИ соответствует лишь знаниям студента первого курса медицинского вуза.

В области юриспруденции результаты ИИ оказались ещё слабее. Адвокат попросил составить юридический меморандум о возможности продажи медицинской информации клиентов. В ответе нейросети отсутствовали ссылки на конкретные регулирующие нормы и законы, а также не был указан характер ответственности — уголовный или гражданский. Юрист констатировал, что источник данных остаётся неясным, доверять такому документу нельзя, и если бы это сделал помощник юриста, его бы отправили переделывать работу.

Психотерапевт протестировал ИИ вопросом о причинах постоянных ссор с партнёрами. Система выдала базовую информацию о том, что конфликты естественны, а их причинами могут быть проблемы с коммуникацией, стресс и различные стили ведения споров. На уточняющий вопрос о том, как определить свой стиль, ИИ посоветовал анализировать прошлое поведение во время ссор. По мнению терапевта, большинство людей не способны на рефлексию непосредственно в момент конфликта, поэтому выданная сухая информация не имеет практической ценности. Психолог сравнил работу ИИ с книгами по самопомощи, отметив, что клиентам нужна не просто информация, а способность её применить, и за такой ответ нейросети он бы потребовал вернуть деньги.

🎭 Креатив и аудиовизуальный контент: шоу-бизнес и медиа 1:29

Графический дизайнер дал задание сделать ребрендинг логотипа McDonald's под веганскую концепцию. Нейросеть сгенерировала четыре варианта изображений, но полностью провалилась в работе с текстом, заменив буквы непонятными символами из вымышленного языка. По мнению дизайнера, хотя четвёртый вариант с органическими цветами оказался относительно удачным, ни один из макетов нельзя сразу отправлять клиенту. Специалист охарактеризовал ИИ как «эволюционировавший Pinterest», пригодный лишь для поиска вдохновения.

Музыкальный продюсер попросил написать поп-песню с аккордами для гитары в стиле Ланы Дель Рей. Система предложила стандартную гармоническую последовательность и банальный текст. Продюсер подобрал темп и создал на этой основе неплохой стартовый бит, признав, что многие песни в индустрии начинаются именно с таких банальных набросков, но полноценно заменить продюсера программа пока не способна.

Стендап-комик поручил ИИ написать шутку об онлайн-знакомствах объёмом не менее 100 слов. Результат содержал заходы про выбор между любовью и «очередным кошатником», а также шутку про встречу в баре с человеком, который оказался твоим отцом со ссылкой на сайт Ancestry.com. Комик признал, что алгоритм правильно уловил ритмику стендапа, что показалось ему пугающим, однако шутки выглядят слегка предвзятыми. По мнению артиста, ИИ может отобрать работу у плохих комиков, но его собственная позиция вне опасности.

Диджей заказал двухчасовой плейлист в стиле uplifting disco для своего радиошоу. ИИ успешно подобрал известных артистов, однако включил в список несуществующий трек «Gotta Keep On» исполнителя Sweet Cream, следов которого нет в интернете. Кроме того, по мнению диджея, машина не способна считывать энергетику танцпола и гибко подстраивать треки под настроение уставших людей.

В медиасфере ИИ также продемонстрировал серьёзные ограничения, которые отметили специалисты разных направлений:

Телеведущий новостей протестировал цифровую аватарку на чтении текста о лесном пожаре. Голос звучал механически, мимика губ выглядела неестественно, а тело оставалось статичным. При переходе на испанский язык ИИ начал смешивать слова и искажать акцент.
Актёр озвучивания дал нейросети текст рекламы экологичной обуви. Результат оказался слишком роботизированным, с одинаковой интонацией в конце каждого предложения. Диктор отметил, что ИИ не понимает жизненного контекста и юмора, поэтому его можно использовать разве что для озвучки сотен часов нудных инструкций.
Инфлюенсер попросила составить подпись к фотографии из Монмартра в Париже. ИИ написал текст с упоминанием собора Сакре-Кёр и обилием хэштегов. Девушка посчитала текст качественным, но отметила, что её аудитория сразу распознает подделку из-за чрезмерного количества эмодзи и отсутствия фирменного сленга.

🍳 Сфера услуг и физический труд: от кухни до пожарной охраны 5:13

Бармен попросил ИИ придумать авторский твист на классический коктейль Негрони. Алгоритм предложил «Шалфейный Негрони», добавив к стандартному рецепту разминание листьев шалфея в смесительном стакане. По оценке бармена, вкус остался классическим, шалфей почти не чувствовался, а самому ИИ не хватило креативности и уточняющих вопросов о предпочтениях клиента, что необходимо для создания по-настоящему индивидуального напитка.

Шеф-повар заказал рецепт блюда для индийского ресторана с маринованием протеина. ИИ использовал много традиционных специй, но забыл ключевой связующий компонент — йогурт. Кроме того, рекомендация запекать курицу при температуре 400 градусов в течение 20–25 минут, по мнению повара, привела бы к пересушиванию мяса. Общая оценка блюда составила 8 из 10, при этом шеф признал, что в плане креативности ИИ подобрался к его работе опасно близко.

Фитнес-тренер оценил предложенную ИИ программу домашних тренировок для сжигания жира, включающую упражнения на все группы мышц. Тренер похвалил разнообразие движений, но раскритиковал отсутствие указания времени отдыха между сетами из 8–10 повторений. Главный минус, по мнению эксперта, заключается в невозможности контролировать технику выполнения упражнений, для чего необходим визуальный контакт с клиентом вживую или по видеосвязи.

Переводчик протестировал перевод начального абзаца романа Эрнеста Хемингуэя «И восходящее солнце» на корейский язык. Специалист обнаружил грубые ошибки: ИИ хаотично смешал разговорную и вежливую формы корейского языка в соседних предложениях, нарушив консистентность текста.

Профессии, требующие непосредственного физического участия или уникальных телесных навыков, оказались полностью защищены от автоматизации. Артист цирка признался, что даже не может придумать задачу, которую мог бы поручить ИИ в своей работе. Завершая эксперимент, пожарный категорично заявил, что у искусственного интеллекта нет ни единого шанса выполнять его обязанности на реальном пожаре.