Спикер Хайджун Ся: «Мы застряли в парадигме приложений, ИИ должен создавать рабочую среду, а не кнопки»

В рамках семинара в Стэнфордском университете (Stanford University) руководитель лаборатории Foundation Interface Lab в Калифорнийском университете в Сан-Диего (UCSD) Хайджун Ся представил концепцию перехода от приложений к «деятельностно-ориентированным» (activity-centered) интерфейсам. Основная идея заключается в использовании генеративного ИИ для создания гибких, персональных сред, которые адаптируются под уникальные задачи пользователя, а не заставляют его подстраиваться под жесткую структуру существующих программ.

🏭 Исторический контекст: ловушка старой парадигмы 2:45

Спикер проводит аналогию между современным ИТ-рынком и первой промышленной революцией . В то время заводы строились вокруг одного парового двигателя, а станки располагались в зависимости от близости к источнику энергии. Когда появилось электричество, владельцы фабрик просто заменили паровые двигатели на электромоторы, не меняя планировку . По данным экономистов Эрика Бринйолфссона и Эндрю Макафи, производительность не росла в течение 30 лет, пока не изменились сами рабочие процессы и планировка помещений .

Хайджун Ся утверждает, что сегодня мы совершаем ту же ошибку:

Мы используем ИИ как «новый мотор» в старой среде приложений.
Современные графические интерфейсы (GUI) заставляют человека быть «источником энергии», который вручную переносит данные между изолированными программами .
Подход «ИИ-агентов» (например, OpenAI Operator) просто заменяет человека в управлении теми же кнопками, но не решает проблему неэффективной архитектуры .

🧩 Почему «приложецентричность» больше не работает 5:44

Спикер ссылается на работы Бонни Нарди, которая считает, что традиционная парадигма интерфейсов не поддерживает сложность и гибкость человеческой деятельности . Приложения — это «жесткие контейнеры», созданные разработчиками на основе усредненных потребностей статистической популяции .

Основные проблемы текущего подхода по мнению Ся:

Несоответствие целям пользователя. Разработчик Airbnb не знает, что конкретному путешественнику критически важны пет-френдли отели, поэтому пользователю приходится заходить в каждую карточку отдельно, чтобы найти эту информацию .
Экономическая нецелесообразность. Разрабатывать отдельное приложение для «написания гранта» или «организации семейного ужина» невыгодно, так как у каждого человека свой уникальный процесс .
Фрагментация. Специалисты по анализу данных вынуждены переключаться между 13 категориями приложений в день .
«Взрыв вкладок». Вместо структурированного плана пользователь получает хаос из открытых страниц в браузере .

🤖 Критика современных ИИ-агентов на примере OpenAI Operator 14:13

Хайджун Ся протестировал OpenAI Operator (доступ к которому стоил $200) для организации званого ужина . Несмотря на технологичность, результат оказался разочаровывающим:

Избыточность действий. Агент тратит 4–5 минут на поиск рецептов, имитируя клики пользователя, что сжигает ресурсы серверов и время .
Ошибки логики. Система зациклилась на поиске ингредиентов, и её пришлось останавливать вручную .
Отсутствие структуры. Через четыре часа работы у пользователя всё так же не было четкого плана — только бесконечная история чата и десятки открытых вкладок .

По мнению спикера, интерфейс ИИ-агента не дает обзорности и возможности легко итерировать задачу.

🍮 Проект Jelly: генерация среды вместо последовательности действий 18:54

Лаборатория Ся разработала систему Jelly, которая использует «спецификационный подход». Вместо того чтобы просто кликать по кнопкам в браузере, ИИ генерирует саму структуру интерфейса под задачу пользователя .

Процесс работы Jelly:

Activity Specification. На основе запроса пользователя (например, «переезд в Сан-Франциско») ИИ определяет ключевые сущности: районы, бюджет, список дел .
UI Specification. Система маппит данные на подходящие виджеты: список районов превращается в таблицу, квартиры — в точки на карте, а даты — в календарь .
Malleability (Гибкость). Пользователь может напрямую менять схему данных. Если добавить в список гостей «вегана», Jelly автоматически обновит меню, список покупок и рецепты, так как все сущности связаны единой логикой .

Хайджун Ся подчеркивает, что целью является создание среды, где ИИ автоматизирует рутину, но человек сохраняет прямой контроль над организацией информации .

📋 Гибкие паттерны: Overview-Detail 32:52

Один из ключевых исследовательских проектов лаборатории посвящен паттерну «Обзор — Детали» (Overview-Detail), который встречается на 156 изученных сайтах более 300 раз (Amazon, Airbnb, почтовые сервисы) .

Спикер продемонстрировал инструменты для манипуляции этим паттерном:

Перенос атрибутов. Пользователь может перетащить цену или рейтинг из «детального вида» в «общий список» (например, отобразить размеры дивана прямо в поиске, чтобы не открывать каждую страницу) .
Генерация новых данных. С помощью промпта можно создать колонку «Общая стоимость», которой нет на сайте — ИИ вычислит её, сложив цену товара и доставки .
Визуальная трансформация. Числовые данные (количество отзывов) можно одним кликом превратить в гистограмму или диаграмму рассеяния для сравнения отелей .
Нормализация данных. ИИ может переформатировать названия товаров от разных вендоров в единый стандарт (например, «Бренд — Разрешение — Частота обновления») для удобства сравнения .

🛡️ Будущее и потенциальные риски 44:41

Спикер верит, что мы находимся в историческом моменте, когда видение пионеров компьютерных наук — Дугласа Энгельбарта, Алана Кея и Ликлайдера — становится достижимым благодаря LLM .

Однако Хайджун Ся выделяет важный риск — «персональные силосы» . Если интерфейс генерируется строго под нужды одного человека, теряется «общая почва» (common ground) с другими людьми, и пользователь может перестать замечать альтернативные варианты или случайную, но полезную информацию (information foraging) . В качестве решения он предлагает всегда оставлять в интерфейсе «периферийную» информацию, чтобы стимулировать исследование новых идей .

В завершение Ся отметил, что в будущем роль дизайнеров может измениться: вместо создания жестких макетов они будут проектировать «гибкие пакеты UI», которые смогут бесшовно подключаться к любым потокам данных .