Как Microsoft создавала Clippy: история от стэнфордских исследований до ретро-культа

a16z 18,3 тыс. 1 ч 14 мин 11 мин 27.04.2019
Главное

В истории ИТ-индустрии мало какой продукт вызывал столь же полярные эмоции, как виртуальный помощник Клиппи (Clippy), дебютировавший в составе офисного пакета Microsoft Office 97. В рамках глубокого анализа истории создания этого интерфейсного решения бывший топ-менеджер Microsoft Стивен Синофски и венчурный партнер фонда a16z Фрэнк Чен разбирают технологические, экономические и социокультурные факторы, которые превратили амбизиозный проект на базе искусственного интеллекта в один из самых известных мемов цифровой эпохи.

💾 Железо из мезозоя: ПК начала 1990-х и кризис юзабилити 2:12

Чтобы понять предпосылки появления Клиппи, необходимо восстановить контекст компьютерной индустрии начала и середины 1990-х годов, до релиза легендарной Windows 95. В то время графический интерфейс пользователя (GUI) прочно ассоциировался только с операционной системой Macintosh и охватывал не более 5–10% рынка. Среднестатистический персональный компьютер обладал следующими техническими характеристиками:

На этом дефицитном железе Microsoft пыталась развивать свой пакет Office. Первая успешная версия Office для Windows существовала на рынке всего около двух лет, когда инженерная команда параллельно разворачивала работу над двумя релизами: Office 95 (внутренняя версия 7.0) и Office 97, запуск которого состоялся в ноябре 1997 года.

Главной проблемой программного обеспечения того времени была его колоссальная сложность. Офисные пакеты содержали тысячи функций. Синофски вспоминает, что интерфейс буквально перегружал пользователя: при открытии программы на экране одновременно отображалось около 250 слов в различных меню. В ходе внутренних тестов разработчики ради эксперимента перевели все меню на немецкий язык — для англоязычных пользователей сложность работы при этом осталась абсолютно неизменной, поскольку интерфейс и так был интуитивно непонятен.

Чтобы решить эту проблему, Microsoft использовала несколько подходов:

Ситуация обострилась, когда на мировой рынок вышли от 40 до 60 миллионов домашних компьютеров. Домашние пользователи, в отличие от корпоративных, не имели оплачиваемого рабочего времени на освоение систем и не были готовы платить $250 за курсы обучения в торговых сетях вроде Sears ради использования текстового процессора за $500 на компьютере стоимостью $4000. Продуктам требовался принципиально новый тип интерфейса.

🧠 Научный фундамент: теория медиауравнения и первые шаги ИИ 6:45

В поисках решения для потребительского рынка исследователи Microsoft обратились к академической базе. Фундаментом для будущих разработок послужило исследование профессоров Стэнфордского университета Клиффа Насса и Байрона Ривза, известное как «медиауравнение» (The Media Equation).

Ученые экспериментально доказали, что взаимодействие человека с технологиями носит глубоко социальный характер. Пользователи подсознательно присваивают компьютерам личностные качества и ведут себя с ними вежливо. Например, эмпирически подтвержденный Нассом и Ривзом факт, что люди склонны говорить «спасибо» голосовым помощникам вроде Siri или Alexa, был зафиксирован ими еще в середине 1990-х годов. Из-за скрытого психологического правила «компьютер умнее меня» человек при возникновении ошибок винил себя, а не интерфейс. Исследователи предположили, что если компьютер начнет общаться вежливо и персонифицированно, это радикально снизит уровень стресса.

Параллельно подразделение Microsoft Research разрабатывало технологические компоненты на стыке лингвистики и математики:

Этот математический аппарат впервые материализовался в Office 95 под названием Answer Wizard (Мастер ответов). Это был первый коммерческий ИИ-компонент Microsoft, позволявший обрабатывать поисковые запросы на естественном языке на локальном компьютере без подключения к интернету, используя всего от 2 до 4 МБ оперативной памяти.

🤡 «Убить этого чертова клоуна»: внутренний разбор у Билла Гейтса 22:46

Идея превратить поисковый алгоритм в анимированного персонажа зародилась в потребительском подразделении Microsoft под руководством Карен Фриз (Karen Freeze), чей менеджер Мелинда Френч (будущая супруга Билла Гейтса) активно поддерживала инновации в сфере домашних интерфейсов. После выпуска детских программ Creative Writer и Fine Artist с персонажем по имени Макзи (McZee) команда создала проект Microsoft Bob — программную оболочку, полностью заменявшую стандартный интерфейс Windows на анимированного помощника.

Пока Microsoft Bob завоевывал неоднозначную репутацию на рынке, команда разработки Office решила объединить социальную концепцию Насса-Ривза, лингвистический движок Answer Wizard и собственную систему мониторинга действий пользователя. Новая технология отслеживала паттерны поведения у экрана (например, последовательность команд «сделать — отменить — сделать иначе») и пыталась проактивно предложить помощь.

Когда Синофски и его коллеги пришли на защиту концепции в кабинет исполнительного директора Microsoft Билла Гейтса, они столкнулись с жестким скепсисом. По воспоминаниям Синофски, Гейтс мгновенно смоделировал сценарий использования интерфейса:

«Допустим, я хочу построить диаграмму. Из угла выскакивает этот клоун и начинает вести меня по шагам: "Далее, далее, далее". Да через пару шагов пользователю просто захочется убить этого чертова клоуна!»

Несмотря на критику со стороны главы компании, проект не был закрыт из-за высокой децентрализации Microsoft того времени. Однако анимированный помощник получил среди инженеров официальное внутреннее венгерское имя типа данных — TFC (The Freaking Clown, «Чертов клоун»). Синофски отдельно подчеркивает, что сам Билл Гейтс не использовал нецензурную лексику, но аббревиатура прочно закрепилась в коде. Риск-профиль команды Office оставался высоким: на фоне жесткой конкуренции с текстовыми процессорами WordPerfect и таблицами Lotus компания не могла позволить себе продавать продукт за $800, который люди физически не понимали как использовать.

🛠️ Разработка Pogo и анимационные уроки от классиков Disney 28:34

На этапе проектирования интерфейса, получившего рабочее название Pogo, команда проводила тысячи часов юзабилити-тестирования за односторонними зеркалами. Прототип, написанный на Visual Basic внутри Excel 5, демонстрировал поразительно высокие результаты: пользователи восторженно реагировали на анимацию ожидания («Смотрите, он думает!») и заявляли, что такой способ получения подсказок гораздо дружелюбнее сухих стандартных индексов.

Однако разработчики столкнулись с суровыми аппаратными ограничениями эпохи VGA-экранов:

Чтобы преодолеть «эффект коробки», руководитель проекта Сэм Хобсон (Sam Hobson) и команда потребительских продуктов организовали консультации с легендарными аниматорами студии Walt Disney — Фрэнком Томасом и Олли Джонстоном, причастными к созданию «Фантазии», «Пиноккио» и «Белоснежки». К удивлению инженеров, пытавшихся избавиться от квадратной рамки, классики анимации заявили, что эта коробка необходима. По мнению Фрэнка и Олли, любому персонажу нужна сцена (stage), которая позволяет ему органично появляться и исчезать, не превращаясь во внезапно испаряющегося инопланетянина.

Диснеевские мастера также предложили ввести концепцию «помощника для помощника», приведя в пример Сверчка Джимини (Jiminy Cricket) из «Пиноккио». Они рекомендовали добавить маленькую канцелярскую кнопку (thumbtack), которая выступала бы контрастным напарником для главного персонажа. Из-за дефицита экранного разрешения 640x480 пикселей эту идею реализовать не удалось, но сам совет заставил команду поверить в правильность выбранного курса.

🐰 Глобальный кастинг и культурный кризис в Японии 35:47

Выбор финального персонажа проходил через масштабные международные исследования. Команда Сэма Хобсона проводила фокус-группы в торговых моллах по всему миру, тестируя тысячи эскизов — от реалистичных животных до мифических существ. Единого лидера не было. Синофски приводит в пример случай с Майком Мейплсом-старшим, «патриархом» подразделения Office и заядлым техасским фермером. Ожидая, что суровый руководитель выберет изображение лошади или внедорожника, команда увидела, как Мейплс за 5 секунд указал на розового пушистого кролика просто потому, что тот напоминал ему о зайцах на его личном ранчо.

В итоге был сформирован стартовый состав помощников: скрепка Клиппи, пес, кошка, дворецкий Босгроув (Bosgrove) и антропоморфная точка. Персонаж в виде Альберта Эйнштейна пришлось в спешном порядке перерисовывать после получения официальной претензии от юристов, управляющих наследием великого физика.

Наиболее серьезный кризис возник перед самым релизом, когда из японского офиса Microsoft (обеспечивавшего на тот момент более половины выручки Office) пришло официальное письмо. Японская сторона категорически возражала против использования созданных персонажей по специфической причине:

В результате дипломатических переговоров Microsoft пошла на компромисс. Для западных рынков персонажей оставили без изменений, но для Японии были созданы эксклюзивные помощники: анимированный дельфин и Office Sensei (персонаж в стиле «офис-леди», отражающий японские бизнес-реалии 1990-х годов). Несмотря на внутренние опасения американского офиса по поводу гендерных стереотипов Office Sensei, японская сторона настояла на локальном культурном контексте. Продукт, поставлявшийся в 150 стран на 40 языках, требовал гибкого баланса между глобализацией и эмпатией к локальному пользователю.

✉️ Бумеранг маркетинга: как Letter Wizard превратил фичу в мем 49:28

Главной тактической ошибкой, предопределившей негативное восприятие Клиппи, стало чрезмерное усердие алгоритмов автоматизации. Синофски признает, что команда «зашла слишком далеко». Центральным элементом маркетинговой кампании и журналистских демонстраций (включая обзоры для журналов Byte и PC Magazine) был показ работы Мастера писем (Letter Wizard) в Microsoft Word.

Технологическая цепочка выглядела логично: написать и распечатать письмо на лазерном принтере вместе с конвертом в 1990-е годы являлось задачей повышенной сложности из-за проблем с центрованием и ориентацией бумаги. Программа Word была снабжена огромной встроенной базой данных по драйверам принтеров. Локальный движок отслеживал ввод текста: как только пользователь писал фразу «Дорогая мама» или «Уважаемый мистер Смит» и нажимал ввод, триггер активировал анимированную скрепку с коронной фразой: «Похоже, вы пытаетесь написать письмо. Нужна помощь?».

Однако в реальной жизни эта автоматизация обернулась раздражением по следующим причинам:

  1. Большинство людей писали простые одностраничные документы и не планировали использовать сложные функции слияния данных (Mail Merge) для рассылки пятидесяти адресатам.
  2. Помощник предлагал дебаггинг интерфейса вместо предоставления готового контента. Пользователям требовались шаблоны (резюме, жалоба на аренду, заявление), а не навязчивый гид по меню.
  3. Эффект неожиданности пугал: внезапное появление персонажа создавало у пользователей ощущение, будто компьютером управляет посторонняя сила.

При этом профильная пресса изначально встретила технологию благосклонно. Стив Возняк в обзоре для BusinessWeek признавался, что сначала был настроен скептически, но в итоге оценил удобство решения. Питер Коффи из PC Week также писал, что анимированный помощник существенно облегчает освоение сложного софта. Проблема заключалась в скрытом разрыве: эксперты хвалили функцию со словами «это полезно для менее подготовленных людей», дистанцируясь от нее, в то время как обычные офисные сотрудники чувствовали себя ущемленными из-за снисходительного тона программы.

⚰️ Похороны со вкусом блюза: отставка и превращение в культ 55:31

Отрицательный шлейф заставил Microsoft начать постепенное отступление. Уже в Office 2000 настройки Клиппи были переведены в менее активный режим, а количество его спонтанных появлений сократили. Окончательное решение о ликвидации персонажа было принято при разработке Office XP, где интерфейс был переориентирован на боковые панели задач (Task Panes).

Маркетолог команды Office Лиза Гарри (Lisa Gurry) превратила закрытие функции в масштабную пиар-кампанию. В Сан-Франциско провели официальные «проводы на пенсию», в рамках которых нанятый актер в костюме Клиппи ездил в метро с картонной табличкой «Пойду на работу за еду». На только зарождающемся веб-рынке Microsoft запустила серию флеш-мультфильмов, где знаменитый комик Гилберт Готтфрид озвучил Клиппи, исполняющего прощальный «Блюз уволенной скрепки». Прощальный текст содержал прямую сатиру на саму компанию: «Они сказали мне по секрету, что аббревиатура XP означает Ex-Paperclip (Бывшая скрепка)». После этого Синофски получил от коллег десятки присланных с Amazon книг под названием «1001 способ использования канцелярской скрепки».

Уход со сцены запустил классический цикл ностальгии, имеющий, по оценке Синофски, временное окно в 20–25 лет. Из объекта насмешек (включая издевательские скетчи на вечернем шоу Конана О'Брайена во время антимонопольного процесса «США против Microsoft») Клиппи трансформировался в культовую фигуру. Уже к 2010 году студенты Стэнфорда, которые в силу возраста никогда не пользовались Office 97 в реальной работе, активно эксплуатировали образ Клиппи в качестве ретро-мема на сайтах вроде Can Has Cheezburger. Напоминанием об этой культурной траектории послужил твит разработчицы Хлои Кондон (Chloe Condon), которая выпустила партию ювелирных украшений и визиток с изображением Клиппи, что и стало триггером для записи воспоминаний Синофски.

🔮 Возвращение агентов: уроки Клиппи для эпохи современного ИИ 1:07:15

Анализируя историческое наследие проекта, Синофски приходит к выводу, что Microsoft не совершила стратегической ошибки в концепции — компания просто опередила свое время, а в технологическом бизнесе «быть слишком рано — это то же самое, что быть неправым». Идея интеллектуальных агентов, отправляемых в сеть для решения задач пользователя, активно обсуждалась в эпоху MIT Media Lab, проектов General Magic и концепта Apple Knowledge Navigator (где роль помощника выполнял анимированный дворецкий в галстуке-бабочке).

Сегодня этот функционал реализован в виде фоновых сервисов: ценовые алерты на Kayak или eBay работают ровно по тем лекалам, которые закладывались в теории агентов тридцать лет назад. Однако фундаментальный разрыв между человеческим намерением и сложным интерфейсом ПО до сих пор не преодолен. Синофски выделяет ключевые рыночные маркеры:

Главный вывод Синофски носит экономический характер: смелые интерфейсные эксперименты, даже если они временно воспринимаются рынком как провал, необходимы для долгосрочного выживания платформ. Microsoft могла позволить себе высокорисковый эксперимент со скрепкой, обладая многомиллиардным бизнесом, и в итоге масштабировала капитализацию до сотен миллиардов долларов. Стремление сократить разрыв между абстрактной мыслью в голове пользователя и физической кнопкой в коде остается ключевым вызовом для индустрии ИИ.

💬 Цитаты

«Через пару шагов пользователю просто захочется убить этого чертова клоуна!»

Стивен Синофски (цитируя Билла Гейтса) 25:27

«Быть слишком рано — это то же самое, что быть неправым.»

Стивен Синофски 1:08:36
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Intent classification
Процесс определения цели или намерения пользователя на основе введенного им текстового запроса.
Bayesian engine
Алгоритмический движок на базе теоремы Байеса, используемый для расчета вероятностей и предсказания действий пользователя.
Mail Merge
Функция автоматического слияния базы данных адресатов с текстом одного шаблона для массовой отправки писем.
📊 Цифры
🗓 Хронология
  1. ноябрь 1997 Официальный релиз офисного пакета Microsoft Office 97 и дебют ассистента Clippy.
  2. 1999 Выход Office 2000, в котором активность и частота появления Клиппи были существенно снижены.
  3. 2001 Запуск Office XP и проведение официальной ироничной пиар-кампании по отправке Клиппи на пенсию.
⚖️ Другая сторона
Технологии и IT Стивен Синофски Microsoft Office Clippy Microsoft Bob Answer Wizard