В современном мире искусственный интеллект чаще всего рассматривается как инструмент для генерации контента или автономный агент, способный имитировать действия человека в браузере. Однако исследователи из Лаборатории фундаментальных интерфейсов Калифорнийского университета в Сан-Диего (UCSD) убеждены, что мы стоим на пороге более глубокой трансформации.
В рамках семинара Стэнфордского университета была представлена концепция «генеративных, пластичных и персональных интерфейсов». Основная идея заключается в том, что ИИ должен не просто заменять человека в управлении старыми приложениями, а создавать совершенно новую, адаптивную информационную среду, ориентированную на конкретные задачи пользователя, а не на жесткие рамки программного обеспечения.
🚂 Урок истории: почему «замена двигателя» не работает 2:45
Спикер проводит параллель между текущим развитием ИИ и первой промышленной революцией . В эпоху паровых двигателей вся фабрика зависела от одной центральной машины, к которой через систему валов и ремней подключались станки. Когда появилось электричество, владельцы заводов поначалу просто заменили паровой двигатель на один мощный электромотор, оставив планировку цеха прежней .
В результате производительность труда не росла на протяжении 30 лет. Только когда инженеры осознали, что электромоторы можно ставить на каждый станок и менять планировку под естественный поток материалов, произошел настоящий скачок .
По мнению исследователя, современные ИИ-агенты (такие как OpenAI Operator или функции компьютерного зрения Anthropic) совершают ту же историческую ошибку :
- Они пытаются заменить человека («источник питания») внутри существующей архитектуры приложений.
- Приложения остаются жесткими «машинами», а ИИ просто нажимает за нас на кнопки.
- Такой подход, по утверждению гостя, не позволяет в полной мере использовать возможности человеческого познания и ИИ.
🧊 Проблема «приложение-центричной» модели 5:31
Традиционный графический интерфейс (GUI) строится вокруг приложений, что, по словам Бонни Нарди, не соответствует сложности и гибкости человеческой деятельности . Разработчики создают софт, ориентируясь на «усредненного пользователя», что порождает две проблемы:
- Жесткость (Rigidity): Приложение предлагает только тот набор функций и данных, который предусмотрел автор. Например, в приложении Airbnb на карте видны цены, но не видны рейтинги или пометка «можно с собаками», пока пользователь не провалится вглубь каждой карточки .
- Перегруженность (Bloatware): Пытаясь удовлетворить всех, разработчики «запихивают» в программу максимум функций, превращая её в неповоротливый комбайн .
В итоге пользователи страдают от «взрыва вкладок» в браузере и хаотичного нагромождения окон, пытаясь скоординировать работу десятка разных сервисов для решения одной задачи .
🧪 Эксперимент с OpenAI Operator: 4 часа на планирование ужина 14:13
Спикер поделился личным опытом использования OpenAI Operator для организации ужина в честь китайского Нового года . Несмотря на технологическое совершенство агента, результат оказался неутешительным:
- Бесконечные циклы: При попытке проверить наличие ингредиентов в Costco и Whole Foods, агент «зациклился» и бесконечно прокручивал список .
- Отказы: На просьбу порекомендовать вино агент ответил отказом по непонятным причинам .
- Итог: Спустя 4 часа работы у пользователя не было структурированного плана. Вместо этого он получил «взорвавшийся» от десятков вкладок браузер и бесконечную историю чата .
Этот пример, по мнению спикера, доказывает, что нам нужен «активностно-центричный» (activity-centered) подход, где ИИ создает среду для задачи, а не просто имитирует клики .
🛋️ Проект Jelly: интерфейс, который собирает себя сам 19:33
В качестве альтернативы была представлена система Jelly, разработанная аспиранткой Римой. Она работает по принципу «спецификации активности» :
- Пользователь вводит промпт (например, «Я переезжаю в Сан-Франциско»).
- ИИ генерирует структуру данных: районы, бюджет, удаленность от офиса.
- Система автоматически сопоставляет эти данные с элементами интерфейса (карты для локаций, календари для дат, таблицы для сравнения) .
Ключевые особенности Jelly:
- Пластичность: Пользователь может напрямую менять схему данных, и интерфейс мгновенно перестроится. Если добавить в список гостей ужина человека с аллергией, система сама обновит меню и список покупок .
- Адаптивность: Когда цель меняется (например, менеджер предложил переехать не в Сан-Франциско, а в Нью-Йорк), пользователь просто меняет одну ячейку, и вся структура с картами и сравнениями сохраняется для нового города .
📊 Манипуляция паттернами: пример Overview-Detail 30:23
Исследователи изучили более 150 сайтов и выделили 300 примеров паттерна «Обзор — Детали» (Overview-Detail) . Это фундаментальный элемент дизайна: список товаров в поиске (обзор) и страница конкретного товара (детали).
Лаборатория создала систему, позволяющую пользователю менять этот паттерн «на лету» :
- Вынос атрибутов: При поиске дивана на eBay пользователь может «вытащить» габариты из описания прямо в общий список, чтобы сравнивать их, не открывая каждую вкладку .
- Использование ИИ для расчетов: Если на сайте нет данных о полной стоимости (цена + доставка), ИИ может сам создать новый атрибут, просуммировав цифры .
- Визуализация: Числовые данные можно в один клик превратить из списка в гистограмму или диаграмму рассеяния (scatter plot) .
- Унификация: ИИ может переформатировать разнородные названия товаров от разных продавцов в единый стандарт для удобства сравнения .
⚠️ Риски и вызовы будущего 50:41
Несмотря на оптимизм, спикер выделяет несколько критических проблем внедрения таких интерфейсов:
- «Персональные бункеры» (Personal Silos): Если интерфейс генерируется только под мои нужды, я могу перестать видеть альтернативные варианты или «случайные» открытия, которые важны для поиска информации .
- Потеря общей почвы: Если у каждого пользователя один и тот же сайт выглядит по-разному, становится сложно обсуждать его с другими людьми или совершать совместные покупки .
- Кривая обучения: Спикер признает риск того, что постоянно меняющийся интерфейс будет требовать от пользователя лишних когнитивных усилий на адаптацию .
- Экономическая модель: Компании (например, Expedia или Amazon) сейчас контролируют каждый пиксель интерфейса ради рекламных целей. Переход к модели, где они просто «поставщики данных», потребует полной смены их бизнес-стратегии .
В завершение дискуссии было отмечено, что подобные идеи — от «аугментации интеллекта» Дугласа Энгельбарта до «динамических медиа» Алана Кея — обсуждаются десятилетиями . Однако именно сейчас, благодаря большим языковым моделям, видение адаптивной информационной среды становится технически достижимым.