# Как ИИ превратит жесткие приложения в пластичные интерфейсы: доклад Stanford Seminar

Источник: https://www.youtube.com/watch?v=MbWgRuM-7X8
Канал: Stanford Online
Опубликовано: 25.02.2025

---

В современном мире искусственный интеллект чаще всего рассматривается как инструмент для генерации контента или автономный агент, способный имитировать действия человека в браузере. Однако исследователи из Лаборатории фундаментальных интерфейсов Калифорнийского университета в Сан-Диего (UCSD) убеждены, что мы стоим на пороге более глубокой трансформации.

В рамках семинара Стэнфордского университета была представлена концепция «генеративных, пластичных и персональных интерфейсов». Основная идея заключается в том, что ИИ должен не просто заменять человека в управлении старыми приложениями, а создавать совершенно новую, адаптивную информационную среду, ориентированную на конкретные задачи пользователя, а не на жесткие рамки программного обеспечения.

## 🚂 Урок истории: почему «замена двигателя» не работает
[[JUMP:02:45]]

Спикер проводит параллель между текущим развитием ИИ и первой промышленной революцией [02:59]. В эпоху паровых двигателей вся фабрика зависела от одной центральной машины, к которой через систему валов и ремней подключались станки. Когда появилось электричество, владельцы заводов поначалу просто заменили паровой двигатель на один мощный электромотор, оставив планировку цеха прежней [03:56].

В результате производительность труда не росла на протяжении 30 лет. Только когда инженеры осознали, что электромоторы можно ставить на каждый станок и менять планировку под естественный поток материалов, произошел настоящий скачок [04:21].

По мнению исследователя, современные ИИ-агенты (такие как OpenAI Operator или функции компьютерного зрения Anthropic) совершают ту же историческую ошибку [05:18]:

*   Они пытаются заменить человека («источник питания») внутри существующей архитектуры приложений.
*   Приложения остаются жесткими «машинами», а ИИ просто нажимает за нас на кнопки.
*   Такой подход, по утверждению гостя, не позволяет в полной мере использовать возможности человеческого познания и ИИ.

## 🧊 Проблема «приложение-центричной» модели
[[JUMP:05:31]]

Традиционный графический интерфейс (GUI) строится вокруг приложений, что, по словам Бонни Нарди, не соответствует сложности и гибкости человеческой деятельности [05:59]. Разработчики создают софт, ориентируясь на «усредненного пользователя», что порождает две проблемы:

1.  **Жесткость (Rigidity):** Приложение предлагает только тот набор функций и данных, который предусмотрел автор. Например, в приложении Airbnb на карте видны цены, но не видны рейтинги или пометка «можно с собаками», пока пользователь не провалится вглубь каждой карточки [09:35].
2.  **Перегруженность (Bloatware):** Пытаясь удовлетворить всех, разработчики «запихивают» в программу максимум функций, превращая её в неповоротливый комбайн [12:42].

В итоге пользователи страдают от «взрыва вкладок» в браузере и хаотичного нагромождения окон, пытаясь скоординировать работу десятка разных сервисов для решения одной задачи [13:36].

## 🧪 Эксперимент с OpenAI Operator: 4 часа на планирование ужина
[[JUMP:14:13]]

Спикер поделился личным опытом использования OpenAI Operator для организации ужина в честь китайского Нового года [14:28]. Несмотря на технологическое совершенство агента, результат оказался неутешительным:

*   **Бесконечные циклы:** При попытке проверить наличие ингредиентов в Costco и Whole Foods, агент «зациклился» и бесконечно прокручивал список [16:28].
*   **Отказы:** На просьбу порекомендовать вино агент ответил отказом по непонятным причинам [16:54].
*   **Итог:** Спустя 4 часа работы у пользователя не было структурированного плана. Вместо этого он получил «взорвавшийся» от десятков вкладок браузер и бесконечную историю чата [18:01].

Этот пример, по мнению спикера, доказывает, что нам нужен «активностно-центричный» (activity-centered) подход, где ИИ создает среду для задачи, а не просто имитирует клики [18:54].

## 🛋️ Проект Jelly: интерфейс, который собирает себя сам
[[JUMP:19:33]]

В качестве альтернативы была представлена система Jelly, разработанная аспиранткой Римой. Она работает по принципу «спецификации активности» [19:50]:

*   Пользователь вводит промпт (например, «Я переезжаю в Сан-Франциско»).
*   ИИ генерирует структуру данных: районы, бюджет, удаленность от офиса.
*   Система автоматически сопоставляет эти данные с элементами интерфейса (карты для локаций, календари для дат, таблицы для сравнения) [21:08].

Ключевые особенности Jelly:

*   **Пластичность:** Пользователь может напрямую менять схему данных, и интерфейс мгновенно перестроится. Если добавить в список гостей ужина человека с аллергией, система сама обновит меню и список покупок [25:11].
*   **Адаптивность:** Когда цель меняется (например, менеджер предложил переехать не в Сан-Франциско, а в Нью-Йорк), пользователь просто меняет одну ячейку, и вся структура с картами и сравнениями сохраняется для нового города [24:03].

## 📊 Манипуляция паттернами: пример Overview-Detail
[[JUMP:30:23]]

Исследователи изучили более 150 сайтов и выделили 300 примеров паттерна «Обзор — Детали» (Overview-Detail) [34:25]. Это фундаментальный элемент дизайна: список товаров в поиске (обзор) и страница конкретного товара (детали).

Лаборатория создала систему, позволяющую пользователю менять этот паттерн «на лету» [35:06]:

*   **Вынос атрибутов:** При поиске дивана на eBay пользователь может «вытащить» габариты из описания прямо в общий список, чтобы сравнивать их, не открывая каждую вкладку [36:11].
*   **Использование ИИ для расчетов:** Если на сайте нет данных о полной стоимости (цена + доставка), ИИ может сам создать новый атрибут, просуммировав цифры [37:35].
*   **Визуализация:** Числовые данные можно в один клик превратить из списка в гистограмму или диаграмму рассеяния (scatter plot) [38:16].
*   **Унификация:** ИИ может переформатировать разнородные названия товаров от разных продавцов в единый стандарт для удобства сравнения [39:24].

## ⚠️ Риски и вызовы будущего
[[JUMP:50:41]]

Несмотря на оптимизм, спикер выделяет несколько критических проблем внедрения таких интерфейсов:

*   **«Персональные бункеры» (Personal Silos):** Если интерфейс генерируется только под мои нужды, я могу перестать видеть альтернативные варианты или «случайные» открытия, которые важны для поиска информации [51:19].
*   **Потеря общей почвы:** Если у каждого пользователя один и тот же сайт выглядит по-разному, становится сложно обсуждать его с другими людьми или совершать совместные покупки [50:53].
*   **Кривая обучения:** Спикер признает риск того, что постоянно меняющийся интерфейс будет требовать от пользователя лишних когнитивных усилий на адаптацию [49:30].
*   **Экономическая модель:** Компании (например, Expedia или Amazon) сейчас контролируют каждый пиксель интерфейса ради рекламных целей. Переход к модели, где они просто «поставщики данных», потребует полной смены их бизнес-стратегии [55:46].

В завершение дискуссии было отмечено, что подобные идеи — от «аугментации интеллекта» Дугласа Энгельбарта до «динамических медиа» Алана Кея — обсуждаются десятилетиями [46:03]. Однако именно сейчас, благодаря большим языковым моделям, видение адаптивной информационной среды становится технически достижимым.