В рамках семинара в Стэнфордском университете (Stanford University) руководитель лаборатории Foundation Interface Lab в Калифорнийском университете в Сан-Диего (UCSD) Хайджун Ся представил концепцию перехода от приложений к «деятельностно-ориентированным» (activity-centered) интерфейсам. Основная идея заключается в использовании генеративного ИИ для создания гибких, персональных сред, которые адаптируются под уникальные задачи пользователя, а не заставляют его подстраиваться под жесткую структуру существующих программ.
🏭 Исторический контекст: ловушка старой парадигмы 2:45
Спикер проводит аналогию между современным ИТ-рынком и первой промышленной революцией . В то время заводы строились вокруг одного парового двигателя, а станки располагались в зависимости от близости к источнику энергии. Когда появилось электричество, владельцы фабрик просто заменили паровые двигатели на электромоторы, не меняя планировку . По данным экономистов Эрика Бринйолфссона и Эндрю Макафи, производительность не росла в течение 30 лет, пока не изменились сами рабочие процессы и планировка помещений .
Хайджун Ся утверждает, что сегодня мы совершаем ту же ошибку:
- Мы используем ИИ как «новый мотор» в старой среде приложений.
- Современные графические интерфейсы (GUI) заставляют человека быть «источником энергии», который вручную переносит данные между изолированными программами .
- Подход «ИИ-агентов» (например, OpenAI Operator) просто заменяет человека в управлении теми же кнопками, но не решает проблему неэффективной архитектуры .
🧩 Почему «приложецентричность» больше не работает 5:44
Спикер ссылается на работы Бонни Нарди, которая считает, что традиционная парадигма интерфейсов не поддерживает сложность и гибкость человеческой деятельности . Приложения — это «жесткие контейнеры», созданные разработчиками на основе усредненных потребностей статистической популяции .
Основные проблемы текущего подхода по мнению Ся:
- Несоответствие целям пользователя. Разработчик Airbnb не знает, что конкретному путешественнику критически важны пет-френдли отели, поэтому пользователю приходится заходить в каждую карточку отдельно, чтобы найти эту информацию .
- Экономическая нецелесообразность. Разрабатывать отдельное приложение для «написания гранта» или «организации семейного ужина» невыгодно, так как у каждого человека свой уникальный процесс .
- Фрагментация. Специалисты по анализу данных вынуждены переключаться между 13 категориями приложений в день .
- «Взрыв вкладок». Вместо структурированного плана пользователь получает хаос из открытых страниц в браузере .
🤖 Критика современных ИИ-агентов на примере OpenAI Operator 14:13
Хайджун Ся протестировал OpenAI Operator (доступ к которому стоил $200) для организации званого ужина . Несмотря на технологичность, результат оказался разочаровывающим:
- Избыточность действий. Агент тратит 4–5 минут на поиск рецептов, имитируя клики пользователя, что сжигает ресурсы серверов и время .
- Ошибки логики. Система зациклилась на поиске ингредиентов, и её пришлось останавливать вручную .
- Отсутствие структуры. Через четыре часа работы у пользователя всё так же не было четкого плана — только бесконечная история чата и десятки открытых вкладок .
По мнению спикера, интерфейс ИИ-агента не дает обзорности и возможности легко итерировать задачу.
🍮 Проект Jelly: генерация среды вместо последовательности действий 18:54
Лаборатория Ся разработала систему Jelly, которая использует «спецификационный подход». Вместо того чтобы просто кликать по кнопкам в браузере, ИИ генерирует саму структуру интерфейса под задачу пользователя .
Процесс работы Jelly:
- Activity Specification. На основе запроса пользователя (например, «переезд в Сан-Франциско») ИИ определяет ключевые сущности: районы, бюджет, список дел .
- UI Specification. Система маппит данные на подходящие виджеты: список районов превращается в таблицу, квартиры — в точки на карте, а даты — в календарь .
- Malleability (Гибкость). Пользователь может напрямую менять схему данных. Если добавить в список гостей «вегана», Jelly автоматически обновит меню, список покупок и рецепты, так как все сущности связаны единой логикой .
Хайджун Ся подчеркивает, что целью является создание среды, где ИИ автоматизирует рутину, но человек сохраняет прямой контроль над организацией информации .
📋 Гибкие паттерны: Overview-Detail 32:52
Один из ключевых исследовательских проектов лаборатории посвящен паттерну «Обзор — Детали» (Overview-Detail), который встречается на 156 изученных сайтах более 300 раз (Amazon, Airbnb, почтовые сервисы) .
Спикер продемонстрировал инструменты для манипуляции этим паттерном:
- Перенос атрибутов. Пользователь может перетащить цену или рейтинг из «детального вида» в «общий список» (например, отобразить размеры дивана прямо в поиске, чтобы не открывать каждую страницу) .
- Генерация новых данных. С помощью промпта можно создать колонку «Общая стоимость», которой нет на сайте — ИИ вычислит её, сложив цену товара и доставки .
- Визуальная трансформация. Числовые данные (количество отзывов) можно одним кликом превратить в гистограмму или диаграмму рассеяния для сравнения отелей .
- Нормализация данных. ИИ может переформатировать названия товаров от разных вендоров в единый стандарт (например, «Бренд — Разрешение — Частота обновления») для удобства сравнения .
🛡️ Будущее и потенциальные риски 44:41
Спикер верит, что мы находимся в историческом моменте, когда видение пионеров компьютерных наук — Дугласа Энгельбарта, Алана Кея и Ликлайдера — становится достижимым благодаря LLM .
Однако Хайджун Ся выделяет важный риск — «персональные силосы» . Если интерфейс генерируется строго под нужды одного человека, теряется «общая почва» (common ground) с другими людьми, и пользователь может перестать замечать альтернативные варианты или случайную, но полезную информацию (information foraging) . В качестве решения он предлагает всегда оставлять в интерфейсе «периферийную» информацию, чтобы стимулировать исследование новых идей .
В завершение Ся отметил, что в будущем роль дизайнеров может измениться: вместо создания жестких макетов они будут проектировать «гибкие пакеты UI», которые смогут бесшовно подключаться к любым потокам данных .