# Спикер Хайджун Ся: «Мы застряли в парадигме приложений, ИИ должен создавать рабочую среду, а не кнопки»

Источник: https://www.youtube.com/watch?v=MbWgRuM-7X8
Канал: Stanford Online
Опубликовано: 25.02.2025

---

В рамках семинара в Стэнфордском университете (Stanford University) руководитель лаборатории Foundation Interface Lab в Калифорнийском университете в Сан-Диего (UCSD) Хайджун Ся представил концепцию перехода от приложений к «деятельностно-ориентированным» (activity-centered) интерфейсам. Основная идея заключается в использовании генеративного ИИ для создания гибких, персональных сред, которые адаптируются под уникальные задачи пользователя, а не заставляют его подстраиваться под жесткую структуру существующих программ.

## 🏭 Исторический контекст: ловушка старой парадигмы
[[JUMP:02:45]]

Спикер проводит аналогию между современным ИТ-рынком и первой промышленной революцией [03:13]. В то время заводы строились вокруг одного парового двигателя, а станки располагались в зависимости от близости к источнику энергии. Когда появилось электричество, владельцы фабрик просто заменили паровые двигатели на электромоторы, не меняя планировку [03:56]. По данным экономистов Эрика Бринйолфссона и Эндрю Макафи, производительность не росла в течение 30 лет, пока не изменились сами рабочие процессы и планировка помещений [04:09].

Хайджун Ся утверждает, что сегодня мы совершаем ту же ошибку:

*   Мы используем ИИ как «новый мотор» в старой среде приложений.
*   Современные графические интерфейсы (GUI) заставляют человека быть «источником энергии», который вручную переносит данные между изолированными программами [04:50].
*   Подход «ИИ-агентов» (например, OpenAI Operator) просто заменяет человека в управлении теми же кнопками, но не решает проблему неэффективной архитектуры [05:18].

## 🧩 Почему «приложецентричность» больше не работает
[[JUMP:05:44]]

Спикер ссылается на работы Бонни Нарди, которая считает, что традиционная парадигма интерфейсов не поддерживает сложность и гибкость человеческой деятельности [05:59]. Приложения — это «жесткие контейнеры», созданные разработчиками на основе усредненных потребностей статистической популяции [11:35].

Основные проблемы текущего подхода по мнению Ся:

1.  **Несоответствие целям пользователя.** Разработчик Airbnb не знает, что конкретному путешественнику критически важны пет-френдли отели, поэтому пользователю приходится заходить в каждую карточку отдельно, чтобы найти эту информацию [09:23].
2.  **Экономическая нецелесообразность.** Разрабатывать отдельное приложение для «написания гранта» или «организации семейного ужина» невыгодно, так как у каждого человека свой уникальный процесс [12:16].
3.  **Фрагментация.** Специалисты по анализу данных вынуждены переключаться между 13 категориями приложений в день [13:23].
4.  **«Взрыв вкладок».** Вместо структурированного плана пользователь получает хаос из открытых страниц в браузере [14:01].

## 🤖 Критика современных ИИ-агентов на примере OpenAI Operator
[[JUMP:14:13]]

Хайджун Ся протестировал OpenAI Operator (доступ к которому стоил $200) для организации званого ужина [14:28]. Несмотря на технологичность, результат оказался разочаровывающим:

*   **Избыточность действий.** Агент тратит 4–5 минут на поиск рецептов, имитируя клики пользователя, что сжигает ресурсы серверов и время [15:23].
*   **Ошибки логики.** Система зациклилась на поиске ингредиентов, и её пришлось останавливать вручную [16:28].
*   **Отсутствие структуры.** Через четыре часа работы у пользователя всё так же не было четкого плана — только бесконечная история чата и десятки открытых вкладок [17:58].

По мнению спикера, интерфейс ИИ-агента не дает обзорности и возможности легко итерировать задачу.

## 🍮 Проект Jelly: генерация среды вместо последовательности действий
[[JUMP:18:54]]

Лаборатория Ся разработала систему **Jelly**, которая использует «спецификационный подход». Вместо того чтобы просто кликать по кнопкам в браузере, ИИ генерирует саму структуру интерфейса под задачу пользователя [19:33].

Процесс работы Jelly:

1.  **Activity Specification.** На основе запроса пользователя (например, «переезд в Сан-Франциско») ИИ определяет ключевые сущности: районы, бюджет, список дел [21:48].
2.  **UI Specification.** Система маппит данные на подходящие виджеты: список районов превращается в таблицу, квартиры — в точки на карте, а даты — в календарь [28:14].
3.  **Malleability (Гибкость).** Пользователь может напрямую менять схему данных. Если добавить в список гостей «вегана», Jelly автоматически обновит меню, список покупок и рецепты, так как все сущности связаны единой логикой [25:11].

Хайджун Ся подчеркивает, что целью является создание среды, где ИИ автоматизирует рутину, но человек сохраняет прямой контроль над организацией информации [27:04].

## 📋 Гибкие паттерны: Overview-Detail
[[JUMP:32:52]]

Один из ключевых исследовательских проектов лаборатории посвящен паттерну «Обзор — Детали» (Overview-Detail), который встречается на 156 изученных сайтах более 300 раз (Amazon, Airbnb, почтовые сервисы) [34:25].

Спикер продемонстрировал инструменты для манипуляции этим паттерном:

*   **Перенос атрибутов.** Пользователь может перетащить цену или рейтинг из «детального вида» в «общий список» (например, отобразить размеры дивана прямо в поиске, чтобы не открывать каждую страницу) [36:11].
*   **Генерация новых данных.** С помощью промпта можно создать колонку «Общая стоимость», которой нет на сайте — ИИ вычислит её, сложив цену товара и доставки [37:21].
*   **Визуальная трансформация.** Числовые данные (количество отзывов) можно одним кликом превратить в гистограмму или диаграмму рассеяния для сравнения отелей [38:16].
*   **Нормализация данных.** ИИ может переформатировать названия товаров от разных вендоров в единый стандарт (например, «Бренд — Разрешение — Частота обновления») для удобства сравнения [39:24].

## 🛡️ Будущее и потенциальные риски
[[JUMP:44:41]]

Спикер верит, что мы находимся в историческом моменте, когда видение пионеров компьютерных наук — Дугласа Энгельбарта, Алана Кея и Ликлайдера — становится достижимым благодаря LLM [45:50].

Однако Хайджун Ся выделяет важный риск — **«персональные силосы»** [51:19]. Если интерфейс генерируется строго под нужды одного человека, теряется «общая почва» (common ground) с другими людьми, и пользователь может перестать замечать альтернативные варианты или случайную, но полезную информацию (information foraging) [51:31]. В качестве решения он предлагает всегда оставлять в интерфейсе «периферийную» информацию, чтобы стимулировать исследование новых идей [52:11].

В завершение Ся отметил, что в будущем роль дизайнеров может измениться: вместо создания жестких макетов они будут проектировать «гибкие пакеты UI», которые смогут бесшовно подключаться к любым потокам данных [57:36].