Как писатель Робин Слоун объединяет старинные ремёсла с нейросетями и робототехникой

Y Combinator 2,3 тыс. 57 мин 10 мин 29.11.2017
Главное

Писатель Робин Слоун, автор бестселлеров «Круглосуточный книжный мистера Пенумбры» и «Закваска», встретился с командой Y Combinator, чтобы обсудить точки соприкосновения традиционных ремёсел и передовых технологий. В центре дискуссии — использование машинного обучения для создания аудиокниг, инженерная сложность роботизированных кухонь и метафизический вызов мимолётности цифровых продуктов. Этот разговор переворачивает привычные представления о технологической дистопии и предлагает вдохновляющий, практичный взгляд на будущее креативных индустрий.

🎵 Музыка из нейросети: первый в истории ML-эксперимент для аудиокниги 0:00

Робин Слоун признаётся, что наряду с традиционной писательской деятельностью его давно преследует глубокий интерес к творческим возможностям машинного обучения. Его привлекают не столько прагматичные экономические сценарии автоматизации, сколько альтернативные способы взаимодействия со словами, изображениями и звуками. Удобный случай для масштабного эксперимента представился во время подготовки аудиоверсии романа «Закваска» (Sourdough).

Индустрия аудиокниг сегодня переживает колоссальный рост. По наблюдениям автора, на встречах в книжных магазинах практически каждый читатель поднимает руку, подтверждая, что регулярно слушает аудиоформаты. Из-за этого продюсеры стали требовательнее и ждут от авторов уникального аудиоопыта, выходящего за рамки простого чтения текста с листа. Сюжет романа «Закваска» напрямую завязан на микробиологической культуре дрожжей, которая аномально развивается под воздействием таинственной, медленной и печальной музыки на неизвестном языке.

Слоун столкнулся с бюджетными ограничениями: у проекта не было средств для найма профессиональных лингвистов и композиторов, создающих искусственные языки уровня дотракийского или клингонского. Решением стало обращение к открытому исходному коду. Автор использовал нейросетевую модель sampleRNN, реализованную на базе фреймворка Torch. Программа, созданная исследовательской группой и доработанная независимым разработчиком Ричардом Тернером (Richard SR), способна извлекать паттерны из звуковых файлов и генерировать на их основе новый контент.

В качестве исходных данных Слоун загрузил в модель личную коллекцию MP3-файлов с традиционным хорватским акапельным пением «Клапа» (Klapa). Домашний глубокий вычислительный риг писателя обрабатывал эти данные несколько дней. По оценке автора, современные алгоритмы пока не могут идеально воспроизводить объекты такой сложности, но характер их ошибок порождает уникальную эстетику. Полученные шёпоты вымышленной музыки были интегрированы в официальную аудиокнигу на платформе Audible, что Слоун считает первым прецедентом включения результатов работы ML-модели в коммерческую аудиокнигу.

🤖 «Проблема яйца» и хаос на роботизированной кухне 7:52

В процессе сбора материала для романа Слоун глубоко погрузился в механику и эстетику работы манипуляторов. Он упоминает позицию режиссера Спайка Джонса, который при создании фильма «Она» принципиально отказался от технических консультантов, чтобы не ограничивать рамки своего воображения суровой реальностью. Слоун же предпочитает глубоко изучать предметную область вместе с экспертами, сохраняя при этом творческую свободу. Не имея в личной собственности промышленного робота, автор компенсировал это глубоким анализом технологической журналистики и изучением пространственных траекторий машин по видеороликам на YouTube.

В книге главная героиня Лоис автоматизирует процесс выпечки с помощью роботизированной руки, сталкиваясь со сложнейшей задачей — разбиванием яиц. Писатель иронично называет этот барьер «Проблемой яйца» с большой буквы. По словам Слоуна, в среде робототехников бытует шутка:

«Всё, что отделяет нас от доминирования в мировой экономике — это создание сильного искусственного интеллекта (AGI) и решение проблемы разбивания яиц».

Слоун утверждает, что пространство обычной домашней или ресторанной кухни представляет собой абсолютно хаотичную, органическую и неразмеченную среду. В отличие от модульных и изначально роботизированных конвейеров условного McDonald's, классическая кухня не поддаётся простой алгоритмизации из-за непредсказуемых углов наклона, скользких поверхностей и нестандартных форм объектов. Тот факт, что живой повар способен координировать множество процессов и мимоходом разбивать яйцо одной рукой, автор называет настоящим «магическим шоу». По сюжету романа героиня осваивает этот навык, как и многие современные люди, благодаря коротким беззвучным туториалам на YouTube.

🌾 Столкновение традиций и кремниевого прогресса: выбор в пользу «варианта С» 12:27

Своим главным источником вдохновения Слоун называет жизнь в районе залива Сан-Франциско, который, несмотря на все социальные проблемы и внутреннюю сложность, остаётся катализатором неординарных человеческих сюжетов. Творчество автора строится на пересечении ИТ-индустрии и древних человеческих ремёсел — книготорговли или хлебопечения.

Автор заявляет о своём глубоком раздражении из-за того, что в медиа и бизнесе отношения между старым и новым постоянно позиционируются как война на выживание. В эпоху зарождения электронных книг индустрия настойчиво требовала ответа, какой формат победит и уничтожит конкурента. Слоун считает такой подход бессмысленным. С его точки зрения, новые технологии никогда полностью не заменяют старые; вместо этого они наслаиваются друг на друга, образуя подобие «великолепной, мирной автомобильной аварии», где высота культурной горы лишь увеличивается. Свои книги он позиционирует как манифест в пользу «варианта С»: отказа от выбора между прошлым и будущим ради обладания обоими мирами.

Писатель соглашается с жанровым определением своего творчества как «пазл-фикшн» (puzzle fiction). При этом содержательно он относит свои романы к литературной прозе с научно-фантастическим уклоном. Его цель как автора — тщательно работать над структурой предложений и создавать повествователей, с которыми читателю искренне хочется проводить время. Слоун сознательно уходит от доминирующего в современной литературе и на телевидении тренда на описание глубоко сломленных, деструктивных персонажей, стремясь создавать голоса, по которым читатель будет скучать после того, как закроет книгу.

🚀 Уход от дистопии: уроки детских книг и влияние микробиома 18:10

Ведущий подкаста приводит слова одного из основателей стартапов YC: подавляющее большинство ИТ-предпринимателей Кремниевой долины сформировалось под влиянием оптимистичных вселенных вроде «Звёздного пути» (Star Trek) или «Автостопом по галактике». В противовес этому, современная поп-культура перенасыщена мрачными дистопиями в духе сериала «Чёрное зеркало». В связи с этим возникает серьёзный вопрос: что смогут построить через 20 лет молодые люди, которые сегодня видят исключительно тёмные сценарии будущего?

Слоун видит в этом вызов для современных фантастов. Он выделяет таких авторов, как Кори Доктороу и Энали Ньюиц, которые отказываются как от создания наивных глянцевых утопий, так и от дистопического радикализма. По мнению Слоуна, необходимо искать путь сквозь реальные шипы жизни, проблемы власти и человеческой боли, но сохранять при этом искренний восторг перед грядущим.

В контексте романа «Закваска» Слоун указывает на неочевидные источники влияния:

💾 Цифровая амнезия: почему код умирает быстрее бумаги 21:16

Слоун не согласен с популярным тезисом о том, что создатель сначала придумывает историю, а затем ищет для неё подходящий сосуд (книгу, игру или сериал). На его взгляд, творческий процесс устроен противоположным образом: сначала возникает детский, чисто эстетический интерес к конкретному формату, и лишь затем внутри этих рамок рождается замысел.

В качестве примера цифрового формата Слоун приводит свою историю с разработкой мобильного приложения Fish, созданного им несколько лет назад ради чистого эксперимента. Писателя восхищала специфика экрана iPhone — отсутствие вкладок браузера и фоновых окон, что заставляло пользователя фокусироваться на одном процессе. Проект был тепло принят аудиторией, но с выходом обновлений iOS код начал устаревать. Недавно Apple уведомила Слоуна о том, что приложение больше не запустится на актуальных версиях ОС (iOS 11 и выше). Поскольку Робин является писателем, а не профессиональным разработчиком, он не смог оперативно найти исходный код проекта, проверяя старые ноутбуки и почтовые архивы. Код был безвозвратно утерян.

Эта ситуация обнажает фундаментальную уязвимость цифровой индустрии. В отличие от бумажной книги, которая после печати способна физически существовать на полке веками, цифровой ландшафт непрерывно сдвигается. Постоянное обновление операционных систем и изменение API вынуждают авторов подписываться на бесконечную техническую поддержку своих прошлых проектов. Слоун соглашается с ремаркой ведущего о том, что в технологических гигантах вроде Google, Facebook или Twitter результаты двухлетней работы инженера могут быть полностью стёрты или переписаны уже через полгода после его увольнения.

Относительную стабильность в цифровой среде сейчас демонстрируют простые веб-страницы на базе HTML и JavaScript, которые сохраняют читаемость на протяжении 30 лет и могут быть заархивированы проектом Internet Archive. Однако этот стек ограничивает возможности создания сложных интерактивных или AR-продуктов. Спасением цифрового искусства сегодня занимаются преимущественно музеи и организации вроде Rhizome, создающие изолированные аппаратные эмуляторы старых операционных систем. Резюмируя, Слоун делает пессимистичный прогноз: он готов сделать ставку на то, что к 2050 или 2060 году огромная часть современного цифрового наследия, включая посты в Facebook и фотографии в Instagram, будет полностью и окончательно уничтожена.

☕ Цифровая гигиена: Твиттер как разговор в кафе и гибель эпохи блогов 29:10

Чтобы противостоять давлению цифрового архива, Слоун использует радикальный метод — специальный скрипт, который регулярно и безвозвратно удаляет его публикации в Twitter. По мнению автора, базовая техническая настройка соцсетей, сохраняющая каждое слово навсегда, глубоко противоестественна. Слоун призывает относиться к Твиттеру не как к официальной стенограмме заседаний Конгресса, к которой оппоненты могут вернуться спустя годы для предъявления обвинений, а как к шумному ночному разговору в кафе. В кофейне люди могут делать поспешные заявления, спорить и шутить, после чего эти слова растворяются в воздухе. Запись и индексация таких повседневных разговоров выглядит антисоциально, поэтому регулярная очистка аккаунта воспринимается писателем как оздоравливающее ментальное очищение.

Размышляя о прошлом, Слоун с ностальгией вспоминает эпоху расцвета независимых блогов, таких как Snark Market, для которого он долгое время писал аналитические эссе. Частота публикаций в таких проектах, по его наблюдениям, находилась в идеальной обратной зависимости от количества часов, которые авторы проводили на основной наёмной работе.

Упадок блогосферы был вызван стремительным взлётом Facebook и Twitter, а также закрытием агрегатора Google Reader, ставшего «последним гвоздём в гроб традиционного блогинга». Слоун описывает блогерское пространство как сложную экосистему идей со своей пищевой цепочкой. Обнаружение редкого профильного блога было сродни нахождению секретного ресурса, ссылки на который авторы неохотно раскрывали коллегам. Сегодня же открытие окна создания поста в WordPress вызывает у автора чувство одиночества, так как текст никто не прочитает, если им принудительно не поделиться в крупных социальных сетях.

К увеличению лимита сообщений в Twitter до 280 символов Слоун относится сугубо положительно, хотя изначально, как и большинство пользователей, испытывал консервативное сопротивление изменениям. Он ссылается на мнение одного из лингвистов:

✍️ Соавторство с алгоритмом: плагин для Atom и будущее текстовых нейросетей 38:40

Слоун убеждён, что прямо сейчас для художников открыто окно уникальных возможностей в сфере машинного обучения, поскольку основные финансовые и инженерные ресурсы мира направлены на сугубо коммерческие задачи — беспилотные автомобили и промышленную автоматизацию. В настоящее время он работает над романом, где часть текста генерируется нейросетью. Его главная цель — сделать так, чтобы это не выглядело дешёвым фокусом, а несло реальную литературную ценность для читателя.

Писатель выражает глубокое уважение команде Google Magenta, которая занимается исследованиями на стыке ИИ и музыки. По его оценке, это одна из немногих групп, которая измеряет свой успех не сухими академическими показателями снижения функции потерь на доли бита, а качественными эстетическими критериями. В отличие от поверхностных инструментов «переноса стиля» (style transfer), которые сводят гений Ван Гога к банальным завихрениям на деревьях, Magenta создаёт полноценные инструменты, интерактивно развивающие навыки самого творца.

Слоун разработал собственный рабочий инструмент — плагин для текстового редактора Atom. Алгоритм, обученный на релевантном литературном корпусе (например, на всех томах «Гарри Поттера»), способен безупречно имитировать стилистику автора. В процессе написания рукописи Слоун может нажать клавишу Tab, запуская генерацию продолжения фразы. При этом интерфейс позволяет автору стрелками на клавиатуре прокручивать альтернативные варианты подсказок, выбирая лучшие. Писатель считает подход «человек в контуре» (human-in-the-loop) критически важным: нейросеть поставляет неожиданные языковые паттерны, но финальное курирование и огранка всегда остаются за человеком.

В завершение встречи Слоун рассказал, как одна короткая строчка из начала книги «Закваска» («Я дитя Хогвартса, и больше всего на свете наше поколение хочет, чтобы его распределили») внезапно превратилась в самостоятельный социальный объект. Тысячи читателей по всему миру стали публиковать фотографии этой страницы в Twitter и Instagram с собственными комментариями. Книга начала распространяться в цифровой среде подобно радиоактивному маркеру в крови. Этот феномен доказал автору, что в XXI веке физическая книга способна успешно трансформироваться в вирусный цифровой артефакт, объединяя изолированные миры интернета и классической литературы.

💬 Цитаты

«Вместо того чтобы новая вещь заменяла старую, всё просто сваливается в одну гигантскую кучу.»

Робин Слоун 14:52

«Я хочу думать о Твиттере не как о стенограмме конгресса, а как о странном переплетенном разговоре в кафе.»

Робин Слоун 30:16
👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
sampleRNN
Каскадная рекуррентная нейросеть, предназначенная для точной генерации цифрового аудиосигнала на основе анализа спектра звука.
Проблема яйца
Ироничный термин инженеров-робототехников, описывающий критическую сложность автоматизации хаотичной и хрупкой кухонной среды.
Клапа (Klapa)
Традиционная форма хорватского акапельного многоголосного пения, отличающаяся сложной гармонической структурой.
📊 Цифры
🗓 Хронология
  1. 2003–2004 Создание Слоуном и Мэттом Томпсоном вирусного футуристического флеш-фильма Epic 2014 о будущем медиасистем.
  2. 2009–2010 Начало активного погружения Слоуна в платформу Twitter и последующая двухлетняя работа внутри компании.
  3. 2012 Публикация романа «Круглосуточный книжный мистера Пенумбры», зафиксировавшего оптимистичный срез ИТ-культуры того времени.
⚖️ Другая сторона
Технологии и IT Робин Слоун Y Combinator Sourdough Machine Learning