Как ИИ превратит жесткие приложения в пластичные интерфейсы: доклад Stanford Seminar

Stanford Online 10,9 тыс. 59 мин 5 мин 25.02.2025
Главное

В современном мире искусственный интеллект чаще всего рассматривается как инструмент для генерации контента или автономный агент, способный имитировать действия человека в браузере. Однако исследователи из Лаборатории фундаментальных интерфейсов Калифорнийского университета в Сан-Диего (UCSD) убеждены, что мы стоим на пороге более глубокой трансформации.

В рамках семинара Стэнфордского университета была представлена концепция «генеративных, пластичных и персональных интерфейсов». Основная идея заключается в том, что ИИ должен не просто заменять человека в управлении старыми приложениями, а создавать совершенно новую, адаптивную информационную среду, ориентированную на конкретные задачи пользователя, а не на жесткие рамки программного обеспечения.

🚂 Урок истории: почему «замена двигателя» не работает 2:45

Спикер проводит параллель между текущим развитием ИИ и первой промышленной революцией . В эпоху паровых двигателей вся фабрика зависела от одной центральной машины, к которой через систему валов и ремней подключались станки. Когда появилось электричество, владельцы заводов поначалу просто заменили паровой двигатель на один мощный электромотор, оставив планировку цеха прежней .

В результате производительность труда не росла на протяжении 30 лет. Только когда инженеры осознали, что электромоторы можно ставить на каждый станок и менять планировку под естественный поток материалов, произошел настоящий скачок .

По мнению исследователя, современные ИИ-агенты (такие как OpenAI Operator или функции компьютерного зрения Anthropic) совершают ту же историческую ошибку :

🧊 Проблема «приложение-центричной» модели 5:31

Традиционный графический интерфейс (GUI) строится вокруг приложений, что, по словам Бонни Нарди, не соответствует сложности и гибкости человеческой деятельности . Разработчики создают софт, ориентируясь на «усредненного пользователя», что порождает две проблемы:

  1. Жесткость (Rigidity): Приложение предлагает только тот набор функций и данных, который предусмотрел автор. Например, в приложении Airbnb на карте видны цены, но не видны рейтинги или пометка «можно с собаками», пока пользователь не провалится вглубь каждой карточки .
  2. Перегруженность (Bloatware): Пытаясь удовлетворить всех, разработчики «запихивают» в программу максимум функций, превращая её в неповоротливый комбайн .

В итоге пользователи страдают от «взрыва вкладок» в браузере и хаотичного нагромождения окон, пытаясь скоординировать работу десятка разных сервисов для решения одной задачи .

🧪 Эксперимент с OpenAI Operator: 4 часа на планирование ужина 14:13

Спикер поделился личным опытом использования OpenAI Operator для организации ужина в честь китайского Нового года . Несмотря на технологическое совершенство агента, результат оказался неутешительным:

Этот пример, по мнению спикера, доказывает, что нам нужен «активностно-центричный» (activity-centered) подход, где ИИ создает среду для задачи, а не просто имитирует клики .

🛋️ Проект Jelly: интерфейс, который собирает себя сам 19:33

В качестве альтернативы была представлена система Jelly, разработанная аспиранткой Римой. Она работает по принципу «спецификации активности» :

Ключевые особенности Jelly:

📊 Манипуляция паттернами: пример Overview-Detail 30:23

Исследователи изучили более 150 сайтов и выделили 300 примеров паттерна «Обзор — Детали» (Overview-Detail) . Это фундаментальный элемент дизайна: список товаров в поиске (обзор) и страница конкретного товара (детали).

Лаборатория создала систему, позволяющую пользователю менять этот паттерн «на лету» :

⚠️ Риски и вызовы будущего 50:41

Несмотря на оптимизм, спикер выделяет несколько критических проблем внедрения таких интерфейсов:

В завершение дискуссии было отмечено, что подобные идеи — от «аугментации интеллекта» Дугласа Энгельбарта до «динамических медиа» Алана Кея — обсуждаются десятилетиями . Однако именно сейчас, благодаря большим языковым моделям, видение адаптивной информационной среды становится технически достижимым.

💬 Цитаты

«Традиционная парадигма интерфейсов не поддерживает сложность, гибкость или социальность человеческой деятельности.»

Бонни Нарди (цитируется спикером) 05:59

«История не повторяется, но она часто рифмуется.»

Марк Твен (цитируется спикером) 02:59
👥 Спикер
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
HCI
Human-Computer Interaction — область науки, изучающая взаимодействие человека и компьютера.
Activity-centered computing
Подход в дизайне, где интерфейс строится вокруг цели пользователя, а не вокруг функций конкретной программы.
Malleable UI
Пластичный пользовательский интерфейс, который может быть легко изменен самим пользователем в процессе работы.
📊 Цифры
🗓 Хронология
  1. 1960-е Джозеф Ликлайдер предлагает концепцию тесной связи человеческого мозга и вычислительной машины.
  2. Прошлые выходные Спикер провел эксперимент с OpenAI Operator для планирования ужина.
  3. 2024 Представление системы Jelly и концепции генеративных интерфейсов на семинаре.
⚖️ Другая сторона
Искусственный интеллект Stanford Online UCSD OpenAI Operator HCI Haijun Xia