Майя Аккерман, исследователь искусственного интеллекта и генеральный директор WaveAI, представляет концепцию «скромных креативных машин», призванных не заменять человека, а расширять его творческие способности. Основываясь на десятилетнем опыте разработки инструментов для музыкантов и писателей, она анализирует этические вызовы индустрии и объясняет, почему симбиоз человека и ИИ всегда будет эффективнее автономных систем.
🎹 От автоматизации к вдохновению: истоки креативного ИИ 0:00
Путь Майи Аккерман в области генеративного ИИ начался задолго до современного бума нейросетей. Ключевым моментом стал 2018 год на Международной конференции по вычислительному творчеству (ICCC), где она протестировала систему Impro-Visor, созданную профессором Робертом Келлером из колледжа Харви-Мадд .
Опыт взаимодействия с этой системой изменил её подход к технологиям:
- Преодоление барьеров: Аккерман, умевшая играть только по нотам, впервые почувствовала свободу импровизации .
- Длительный эффект: Навыки, полученные в ходе двухчасовой сессии с ИИ, остались с ней и после отключения программы .
Другим знаковым проектом стала система ALYSIA, разработанная Аккерман в 2016 году. Система превращала английский текст в вокальные мелодии . В качестве эксперимента Аккерман и концептуальный художник Джеймс Морган переобучили модель на произведениях Джакомо Пуччини, находящихся в общественном достоянии. В результате Морган, никогда не игравший на музыкальных инструментах и не знавший итальянского, смог написать полноценную итальянскую арию о женщине, летящей на драконе внутри видеоигры . Это произведение позже экспонировалось в музеях по всему миру .
🚀 WaveAI и создание LyricStudio 3:02
В конце 2017 года Майя Аккерман основала WaveAI — один из первых стартапов в сфере музыкального ИИ . По её словам, успех пришёл только к третьему продукту компании — LyricStudio, который сегодня используют миллионы людей .
Главные уроки разработки LyricStudio:
- Приоритет человеческого ввода: Основную часть интерфейса занимает текстовое поле, приглашающее пользователя писать самостоятельно .
- ИИ как помощник, а не автор: Система предлагает идеи, только когда автор заходит в тупик, не пытаясь угадать «наиболее вероятную» следующую строку .
- Обратный эффект привыкания: Вопреки традиционным стартап-метрикам (удержание через зависимость), пользователи LyricStudio становились лучшими авторами «с ручкой и бумагой» даже вне приложения .
Аккерман утверждает, что их продукт оставил «постоянный положительный отпечаток на креативности людей», что радикально отличается от современных продуктов «однодневок», которые выдают готовый результат по одному клику, лишая пользователя чувства сопричастности .
💰 Переломный момент 2022 года и давление инвесторов 5:15
До конца 2022 года сфера генеративного ИИ оставалась узкоспециализированной нишей. Ситуация изменилась в ноябре 2022 года. По воспоминаниям Аккерман, отправной точкой стал не релиз ChatGPT, а успех Stability AI .
Ключевые события этого периода:
- Stability AI: Глава компании, выходец из хедж-фондов без опыта в ИИ, привлёк $101 млн на развитие генеративных моделей .
- Смена парадигмы: Инвесторы, ранее утверждавшие, что «генеративный ИИ никогда не станет значимым», внезапно начали требовать решений для замены человеческого труда .
- Этический выбор: Компании Аккерман предлагали крупные суммы за переориентацию технологий на полную замену музыкантов. Она отказалась, полагая, что потратить десятилетие на помощь творцам, а затем заменить их — неприемлемо .
По мнению Аккерман, в творческих индустриях сейчас происходит опасный сдвиг: подписываются контракты с «ИИ-музыкантами» и планируется использование «ИИ-актеров», хотя технологии ещё не достигли нужного уровня .
🧠 Скромные машины против «Всезнающего оракула» 9:06
Аккерман критикует доминирующую концепцию ИИ как «всезнающего оракула» или «божества», которое должно давать готовые ответы на все вопросы . Вместо этого она предлагает видение «скромных креативных машин» (humble creative machines).
Аргументы Аккерман в пользу потенциала человека:
- Сравнение с психоделиками: По её утверждению, люди в состоянии изменённого сознания (под воздействием психоделиков) способны генерировать детализированные визуальные образы и видео быстрее и гибче, чем современные text-to-image модели .
- Недофинансирование людей: Огромные средства вкладываются в ИИ, в то время как традиционное образование и развитие человеческих способностей получают значительно меньше ресурсов .
Аккерман приводит аналогию со своим сыном Алексом: если общение с сыном делает её более креативной, это не значит, что он рисует за неё или она становится зависимой от его присутствия . Взаимодействие должно оставлять длительный эффект, делая человека «перманентно умнее» .
🖼️ Галлюцинации как инструмент творчества 21:50
В технической среде галлюцинации ИИ считаются багами, которые нужно исправлять. Однако Аккерман предлагает рассматривать их как фичу .
Её позиция по галлюцинациям:
- Механизм мышления: Галлюцинация — это то, как мы думаем. Она упоминает проект DeepDream Александра Мордвинцева (в транскрипте — Александр Митрович) из Google, который показал, что при усилении работы нейросети возникают образы, похожие на человеческие галлюцинации .
- Отказ от истины: В творчестве нет понятий «правильно» или «неправильно», поэтому усиление способности машины к «фантазированию» критически важно .
🛠️ Принципы дизайна «Скромного ИИ» 24:22
Для создания инструментов, которые способствуют росту пользователя, Аккерман предлагает следующие принципы проектирования интерфейсов (UI):
- Приоритет независимости: Пользователь должен иметь возможность делать всё самостоятельно, насколько позволяют навыки. UI должен приглашать к независимости .
- Пространство для творчества: В LyricStudio большую часть экрана занимает пустое текстовое поле («старая технология»), а ИИ находится сбоку как помощник .
- Роль учителя: ИИ должен быть похож на «хорошего учителя», который не выхватывает инструмент из рук со словами «ты слишком медленный», а помогает только там, где это необходимо .
Аккерман считает, что успех больших языковых моделей (LLM) обусловлен именно тем, что они позволяют пользователю расти. Если бы всё сводилось к одной кнопке «получить результат», интерес к ним быстро бы угас .
⚖️ Демократизация или консолидация? 46:11
В ходе дискуссии был поднят вопрос о том, не является ли «демократизация творчества» на самом деле «консолидацией экономической жизнеспособности» .
Ответ Майи Аккерман:
- Ловушка термина: Она согласна, что слово «демократизация» часто используется как прикрытие.
- Скрытая замена: Если компания говорит, что демократизирует ваше умение писать музыку, но на деле отодвигает вас в сторону и пишет песню сама — это не демократизация, а замена .
- Истинная цель: Настоящая ценность технологий — в повышении способностей человека, которые останутся с ним даже «если электричество отключится навсегда» .
✨ Жизнь против Кремния: личный манифест 16:40
В завершение Аккерман поделилась личной историей, вошедшей в её книгу. Она сравнила создание ИИ-кода с процессом вынашивания ребёнка. По её мнению, в гонке за ИИ человечество забыло о «самом священном и сложном акте творения» — создании биологической жизни .
Она утверждает, что:
- Беременность и создание жизни сложнее и глубже любых академических исследований или разработки алгоритмов .
- ИИ никогда не сможет заменить вес новорождённого на руках или взгляд существа, которое знает тебя «прежде, чем узнает, что такое знание» .
- Общество неоправданно готово рисковать экосистемами и массовой безработицей ради обучения моделей, забывая о приоритете реального над искусственным .
«Пусть машины делают то, что они делают — помогают и поддерживают. Но не просите их заменить величайшее творение из всех — потому что они не могут и не должны», — заключает Аккерман .