Будущее интерфейсов: Как ИИ меняет взаимодействие с софтом 🚀 0:00
Эпоха привычных чат-интерфейсов подходит к концу. На смену статичным 2D-формам приходят «активные» интерфейсы, ориентированные не на заполнение полей, а на выполнение конкретных действий (verbs). В недавнем выпуске Y Combinator ведущий Аарон и создатель Notion Calendar Рафаэль Шад разобрали передовые AI-проекты, чтобы понять, как будет выглядеть взаимодействие человека и машины в ближайшее десятилетие.
🎙️ Голосовой ИИ: Между роботом и человеком 1:18
Одной из главных проблем голосовых агентов остается задержка (latency) и отсутствие визуальной обратной связи.
- Vapi: Инструмент для разработчиков, позволяющий создавать голосовых агентов за считанные минуты.
- Важность данных: Vapi отображает задержку в миллисекундах прямо в интерфейсе. По мнению ведущих, это критически важно: когда пользователь видит задержку, он начинает лучше понимать «ритм» общения, и инструмент превращается из «глючного робота» в предсказуемый рабочий инструмент.
- Retail AI: Сервис для автоматизации звонков (сбор долгов, запись на прием). Главный вывод: ИИ способен на лету адаптироваться к контексту. Если собеседник меняет условия (например, говорит, что он не тот человек, за которого его приняли), агент корректирует сценарий.
По мнению авторов, в будущем мы увидим гибридные модели: ИИ берет на себя 50% простых звонков, а при возникновении сложности или смены контекста система переключает линию на человека, предоставляя ему полный транскрипт беседы.
🧩 Канва как новый стандарт для ИИ-процессов 8:24
Когда ИИ-агенты выполняют длинные цепочки действий автономно, пользователю крайне сложно отслеживать их логику. Решением становится визуальное моделирование процессов на свободном «холсте» (canvas).
- GumLoop: Инструмент визуального программирования автоматизаций без кода.
- Почему это работает: Вместо линейного списка задач пользователь получает интерактивную схему.
- Будущее дизайна: Авторы предполагают, что через 10 лет такие канва-интерфейсы станут стандартом для управления сложными автономными агентами, выполняя роль «пульта управления» ИИ-процессами. Интересно, что сама концепция напоминает старые блок-схемы разработчиков чипов — «старое становится новым», но теперь с интерактивностью в реальном времени.
📈 Таблицы на стероидах: Answer Grid 13:17
Answer Grid меняет способ поиска данных: из простого чата — в структурированную таблицу.
- Human-in-the-loop: Пользователь вводит промпт, и агент самостоятельно идет в интернет, собирает данные по каждой компании и заполняет ячейки.
- Проблема доверия: ИИ склонен к галлюцинациям, поэтому критически важно наличие ссылок на источники. По мнению участников, паттерн «инлайновых сносок» (как в академических работах) становится новым стандартом верификации данных, который делает результаты ИИ заслуживающими доверия.
🎨 Проектирование интерфейсов и «стеклянный» дизайн 19:15
- PolyAI: AI-дизайнер, способный превращать текстовые промпты в готовый код интерфейса.
- Главный вызов: Проблема «длинного ожидания» (latency). Поскольку генерация сложного дизайна занимает время, пользователю нужен визуальный отклик. Авторы предлагают заимствовать опыт метапоисковиков авиабилетов: показывать промежуточные результаты в низком разрешении, чтобы пользователь мог начать взаимодействие немедленно.
- Итеративность: Возможность вносить правки в конкретные модули («сделай сайдбар синим») вместо перегенерации всей страницы — это настоящий фронтир в дизайне ИИ-интерфейсов.
📧 Адаптивные почтовые клиенты: Zuni 26:25
Zuni предлагает «умный» inbox, где интерфейс меняется в зависимости от содержания письма.
- Контекстные кнопки: Вместо статичного меню из «миллиона кнопок» (как в Word) пользователю предлагаются только те действия, которые уместны для конкретного email.
- Риск путаницы: Участники отмечают сложность использования «горячих клавиш» в таких адаптивных интерфейсах. Если кнопки постоянно меняются местами, пользователю сложно выработать мышечную память, но если сохранять предсказуемость клавиш, даже при динамических интерфейсах, это может стать «киллер-фичей» для продуктивности.
📹 Deepfake как инструмент видеопроизводства: Argil.ai 30:21
- Технология: Создание ИИ-аватара требует всего нескольких минут видеообучения.
- Дизайн-трюк: Чтобы скрыть задержку при генерации видео с точной липсинк-анимацией, сервис сначала выдает «размытую» версию видео с чистым звуком. Это позволяет пользователю проверить сценарий немедленно, не дожидаясь 12-минутной обработки высококачественного видео.