Деви Парикх о том, как алгоритмы помогают людям создавать «случайное творчество»

The TWIML AI Podcast 722 45 мин 4 мин 17.08.2020
Главное

В новом выпуске подкаста TWIML AI Сэм Чаррингтон беседует с Деви Парикх, доцентом Школы интерактивных вычислений Georgia Tech и специалистом Facebook AI Research (FAIR). В центре внимания — концепция «случайного творчества», где ИИ выступает не как замена художника, а как катализатор вдохновения и партнер в итеративном процессе созидания.

🎓 Путь от архитектуры процессоров к визуальному разуму 0:04

Деви Парикх совмещает академическую карьеру в Georgia Tech в Атланте с исследовательской деятельностью в FAIR. По словам гостьи, её приход в сферу ИИ во многом был делом случая . Будучи студенткой третьего курса, она планировала заняться компьютерной архитектурой, но из-за ошибки в распределении попала в проект по машинному обучению (в то время называвшемуся «распознаванием образов»).

Переход в область компьютерного зрения произошёл на первом курсе аспирантуры под влиянием коллег. Парикх утверждает, что визуальный аспект работы с изображениями показался ей более интуитивным и доступным, чем анализ вторжений в компьютерных сетях, которым она занималась до этого . Последние несколько лет её основной фокус находился на стыке зрения и языка (VQA, подписи к изображениям), что естественным образом привело к изучению взаимодействия человека и ИИ в творческих задачах.

🎨 Философия творчества и роль ИИ 5:36

В преддверии своего выступления на воркшопе CVPR «Компьютерное зрение для моды, искусства и дизайна», Парикх сформулировала свой взгляд на то, что такое креативность в контексте технологий.

Гостья опирается на определение, согласно которому креативность — это любая новая идея, обладающая ценностью . Она выделяет два критических компонента:

  1. Новизна (Novelty): Создание чего-то, что не существовало ранее. По мнению Парикх, новизна сама по себе недостаточна, так как случайный шум или бессвязный набор слов тоже новы, но бесполезны .
  2. Ценность (Value): Полезность или эстетическая значимость результата. Парикх признает, что понятие ценности крайне субъективно, и исследовательское сообщество часто переносит споры о креативности именно в плоскость определения ценности .

Парикх полагает, что вопрос «может ли ИИ быть творческим сам по себе» вторичен. Её больше занимает вопрос, могут ли машины помочь людям быть более творческими, чем те были бы в одиночку . Она рассматривает это как командную работу, где ИИ может давать «зерно вдохновения», а человек — развивать его.

🖌️ Классификация творческих инструментов: от чертежа до каракулей 13:57

Парикх предлагает разделять творческие задачи на две категории по их целям:

Проект Casual Creator: ИИ как рекомендательная система вкуса

В рамках работы над «случайными творцами» Парикх исследовала инструменты для генеративного искусства, основанные на коде. Пользователь крутит параметры (цвета, кривизна линий), а алгоритм выдает геометрические паттерны.

В ходе экспериментов на Amazon Mechanical Turk команда собирала данные о парных предпочтениях пользователей . Цель заключалась в том, чтобы понять, существует ли корреляция между выбором цветовой палитры и предпочтением, например, толщины линий. Парикх утверждает, что система способна предсказывать будущие симпатии пользователя, что позволяет сузить пространство поиска и помочь человеку быстрее найти «тот самый» результат .

Нейросимволическое искусство

Еще один подход, обсуждаемый в статье, — объединение символьных алгоритмов (где правила заданы четко) и нейросетей (GAN) .

💃 Танец как порождение алгоритма 27:40

Одним из самых необычных проектов Парикх стала попытка научить машину находить танцевальные движения, синхронизированные с музыкой, без использования обучающих данных с реальными танцорами.

🤝 Коллективное творчество и визуальные дневники 36:42

Парикх также изучает механизмы сотрудничества. В одном эксперименте исследовалось, как группа людей создает общие эскизы на холсте.

Были выявлены следующие закономерности:

  1. Индивидуальный рисунок: Четкий, высокого качества, но часто предсказуемый и скучный .
  2. Хаотичное сотрудничество: Люди рисуют по очереди без координации. Результат получается крайне необычным, но слишком шумным и бессвязным .
  3. Сотрудничество с голосованием: Когда человек выбирает один из пяти предложенных вариантов развития холста перед тем, как добавить свой штрих. Это, по мнению Парикх, создает идеальный баланс: результат получается качественным (из-за фильтрации шума) и при этом неожиданным, так как в нем смешаны идеи разных авторов .

Последний упомянутый проект — Visual Journaling . Система на базе NLP анализирует записи в дневнике пользователя, выделяет ключевые темы (семья, работа, еда) и эмоции (всего около 18 типов). На основе этих данных ИИ генерирует абстрактную картину: форма соответствует теме, а цвета — настроению. Парикх считает, что такая визуализация превращает рутинное ведение дневника в создание личной галереи искусств, что повышает вовлеченность людей .

💬 Цитаты

«Креативность — это, по сути, любая новая идея, имеющая ценность. Весь прогресс человечества зиждется на этом.»

Деви Парикх 06:56

«Мне важнее знать, могут ли машины помочь людям быть более творческими, чем они были бы в одиночку.»

Деви Парикх 11:49
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Casual Creators
Инструменты, предназначенные не для профессиональной работы, а для творческого исследования и получения удовольствия пользователями-любителями.
VQA (Visual Question Answering)
Задача в ИИ, где система должна отвечать на текстовые вопросы по содержанию изображения.
Нейросимволический подход
Метод в ИИ, сочетающий нейронные сети для распознавания образов и символьную логику для управления правилами.
📊 Цифры
🗓 Хронология
  1. 3-й курс бакалавриата Деви Парикх случайно попадает в проект по машинному обучению вместо компьютерной архитектуры.
  2. Около 2016–2017 гг. Парикх начинает работать в Georgia Tech.
  3. 2020 Запись интервью и выступление на воркшопе CVPR по теме AI + Creativity.
⚖️ Другая сторона
Искусственный интеллект Devi Parikh Facebook AI Research Casual Creators Georgia Tech компьютерное зрение