Майя Аккерман: «ИИ должен быть скромным учителем, а не всезнающим богом»

Майя Аккерман, исследователь искусственного интеллекта и генеральный директор WaveAI, представляет концепцию «скромных креативных машин», призванных не заменять человека, а расширять его творческие способности. Основываясь на десятилетнем опыте разработки инструментов для музыкантов и писателей, она анализирует этические вызовы индустрии и объясняет, почему симбиоз человека и ИИ всегда будет эффективнее автономных систем.

🎹 От автоматизации к вдохновению: истоки креативного ИИ 0:00

Путь Майи Аккерман в области генеративного ИИ начался задолго до современного бума нейросетей. Ключевым моментом стал 2018 год на Международной конференции по вычислительному творчеству (ICCC), где она протестировала систему Impro-Visor, созданную профессором Робертом Келлером из колледжа Харви-Мадд .

Опыт взаимодействия с этой системой изменил её подход к технологиям:

Преодоление барьеров: Аккерман, умевшая играть только по нотам, впервые почувствовала свободу импровизации .
Длительный эффект: Навыки, полученные в ходе двухчасовой сессии с ИИ, остались с ней и после отключения программы .

Другим знаковым проектом стала система ALYSIA, разработанная Аккерман в 2016 году. Система превращала английский текст в вокальные мелодии . В качестве эксперимента Аккерман и концептуальный художник Джеймс Морган переобучили модель на произведениях Джакомо Пуччини, находящихся в общественном достоянии. В результате Морган, никогда не игравший на музыкальных инструментах и не знавший итальянского, смог написать полноценную итальянскую арию о женщине, летящей на драконе внутри видеоигры . Это произведение позже экспонировалось в музеях по всему миру .

🚀 WaveAI и создание LyricStudio 3:02

В конце 2017 года Майя Аккерман основала WaveAI — один из первых стартапов в сфере музыкального ИИ . По её словам, успех пришёл только к третьему продукту компании — LyricStudio, который сегодня используют миллионы людей .

Главные уроки разработки LyricStudio:

Приоритет человеческого ввода: Основную часть интерфейса занимает текстовое поле, приглашающее пользователя писать самостоятельно .
ИИ как помощник, а не автор: Система предлагает идеи, только когда автор заходит в тупик, не пытаясь угадать «наиболее вероятную» следующую строку .
Обратный эффект привыкания: Вопреки традиционным стартап-метрикам (удержание через зависимость), пользователи LyricStudio становились лучшими авторами «с ручкой и бумагой» даже вне приложения .

Аккерман утверждает, что их продукт оставил «постоянный положительный отпечаток на креативности людей», что радикально отличается от современных продуктов «однодневок», которые выдают готовый результат по одному клику, лишая пользователя чувства сопричастности .

💰 Переломный момент 2022 года и давление инвесторов 5:15

До конца 2022 года сфера генеративного ИИ оставалась узкоспециализированной нишей. Ситуация изменилась в ноябре 2022 года. По воспоминаниям Аккерман, отправной точкой стал не релиз ChatGPT, а успех Stability AI .

Ключевые события этого периода:

Stability AI: Глава компании, выходец из хедж-фондов без опыта в ИИ, привлёк $101 млн на развитие генеративных моделей .
Смена парадигмы: Инвесторы, ранее утверждавшие, что «генеративный ИИ никогда не станет значимым», внезапно начали требовать решений для замены человеческого труда .
Этический выбор: Компании Аккерман предлагали крупные суммы за переориентацию технологий на полную замену музыкантов. Она отказалась, полагая, что потратить десятилетие на помощь творцам, а затем заменить их — неприемлемо .

По мнению Аккерман, в творческих индустриях сейчас происходит опасный сдвиг: подписываются контракты с «ИИ-музыкантами» и планируется использование «ИИ-актеров», хотя технологии ещё не достигли нужного уровня .

🧠 Скромные машины против «Всезнающего оракула» 9:06

Аккерман критикует доминирующую концепцию ИИ как «всезнающего оракула» или «божества», которое должно давать готовые ответы на все вопросы . Вместо этого она предлагает видение «скромных креативных машин» (humble creative machines).

Аргументы Аккерман в пользу потенциала человека:

Сравнение с психоделиками: По её утверждению, люди в состоянии изменённого сознания (под воздействием психоделиков) способны генерировать детализированные визуальные образы и видео быстрее и гибче, чем современные text-to-image модели .
Недофинансирование людей: Огромные средства вкладываются в ИИ, в то время как традиционное образование и развитие человеческих способностей получают значительно меньше ресурсов .

Аккерман приводит аналогию со своим сыном Алексом: если общение с сыном делает её более креативной, это не значит, что он рисует за неё или она становится зависимой от его присутствия . Взаимодействие должно оставлять длительный эффект, делая человека «перманентно умнее» .

🖼️ Галлюцинации как инструмент творчества 21:50

В технической среде галлюцинации ИИ считаются багами, которые нужно исправлять. Однако Аккерман предлагает рассматривать их как фичу .

Её позиция по галлюцинациям:

Механизм мышления: Галлюцинация — это то, как мы думаем. Она упоминает проект DeepDream Александра Мордвинцева (в транскрипте — Александр Митрович) из Google, который показал, что при усилении работы нейросети возникают образы, похожие на человеческие галлюцинации .
Отказ от истины: В творчестве нет понятий «правильно» или «неправильно», поэтому усиление способности машины к «фантазированию» критически важно .

🛠️ Принципы дизайна «Скромного ИИ» 24:22

Для создания инструментов, которые способствуют росту пользователя, Аккерман предлагает следующие принципы проектирования интерфейсов (UI):

Приоритет независимости: Пользователь должен иметь возможность делать всё самостоятельно, насколько позволяют навыки. UI должен приглашать к независимости .
Пространство для творчества: В LyricStudio большую часть экрана занимает пустое текстовое поле («старая технология»), а ИИ находится сбоку как помощник .
Роль учителя: ИИ должен быть похож на «хорошего учителя», который не выхватывает инструмент из рук со словами «ты слишком медленный», а помогает только там, где это необходимо .

Аккерман считает, что успех больших языковых моделей (LLM) обусловлен именно тем, что они позволяют пользователю расти. Если бы всё сводилось к одной кнопке «получить результат», интерес к ним быстро бы угас .

⚖️ Демократизация или консолидация? 46:11

В ходе дискуссии был поднят вопрос о том, не является ли «демократизация творчества» на самом деле «консолидацией экономической жизнеспособности» .

Ответ Майи Аккерман:

Ловушка термина: Она согласна, что слово «демократизация» часто используется как прикрытие.
Скрытая замена: Если компания говорит, что демократизирует ваше умение писать музыку, но на деле отодвигает вас в сторону и пишет песню сама — это не демократизация, а замена .
Истинная цель: Настоящая ценность технологий — в повышении способностей человека, которые останутся с ним даже «если электричество отключится навсегда» .

✨ Жизнь против Кремния: личный манифест 16:40

В завершение Аккерман поделилась личной историей, вошедшей в её книгу. Она сравнила создание ИИ-кода с процессом вынашивания ребёнка. По её мнению, в гонке за ИИ человечество забыло о «самом священном и сложном акте творения» — создании биологической жизни .

Она утверждает, что:

Беременность и создание жизни сложнее и глубже любых академических исследований или разработки алгоритмов .
ИИ никогда не сможет заменить вес новорождённого на руках или взгляд существа, которое знает тебя «прежде, чем узнает, что такое знание» .
Общество неоправданно готово рисковать экосистемами и массовой безработицей ради обучения моделей, забывая о приоритете реального над искусственным .

«Пусть машины делают то, что они делают — помогают и поддерживают. Но не просите их заменить величайшее творение из всех — потому что они не могут и не должны», — заключает Аккерман .