🤖 Эволюция виртуальных помощников: от Xerox PARC до нейросетей 0:00
Идея виртуального цифрового помощника, способного понимать естественный язык и выполнять поручения пользователя, существует в индустрии технологий уже почти полвека. Дэвид Пирс, ведущий подкаста The Vergecast, исследует, как мечта о «разговорном интерфейсе» прошла путь от экспериментальных лабораторий 1970-х годов до современных больших языковых моделей (LLM), таких как ChatGPT и Bing. В центре внимания — беседа с Ричардом Сочером, основателем и CEO платформы you.com, который рассуждает о будущем ИИ-ассистентов, проблемах поиска информации и о том, почему пользовательский опыт важнее простого «хайпа» вокруг нейросетей.
🕰 Истоки «разговорного интерфейса» 0:00
История ИИ-помощников началась задолго до появления современных чат-ботов. В 1979 году Стив Джобс посетил исследовательский центр Xerox PARC, где увидел графический пользовательский интерфейс (GUI), ставший основой для Macintosh. Однако в других лабораториях PARC велась работа над иным проектом — «разговорным пользовательским интерфейсом» (CUI).
- Концепция: Исследователи стремились создать систему, которой не нужно было бы давать команды кодом или текстом. Вместо этого пользователь мог просто задавать вопросы на обычном языке.
- Система GUS (Genial Understander System): В 1977 году исследователи продемонстрировали проект GUS, способный помочь пользователю забронировать авиабилет, уточняя детали поездки в ходе естественного диалога.
Хотя в итоге победил графический интерфейс (GUI), идея «цифрового ассистента» оставалась крайне привлекательной для индустрии на протяжении десятилетий.
🚀 you.com: от поисковика к ИИ-ассистенту 5:12
Ричард Сочер, имеющий многолетний опыт в области обработки естественного языка (NLP), рассматривает поисковые системы как наиболее масштабное поле применения ИИ-технологий. Изначально проект you.com позиционировался как поисковик, так как именно так пользователи привыкли начинать поиск информации в интернете. Однако со временем позиционирование компании изменилось.
- Ребрендинг: По словам Сочера, компания официально отказалась от термина «поисковая система», чтобы подчеркнуть роль платформы как разговорного ИИ-ассистента.
- Влияние ChatGPT: По мнению Сочера, успех ChatGPT стал поворотным моментом, который помог обычным пользователям осознать возможности чат-интерфейсов для поиска и обучения.
- Доверие: Одной из ключевых особенностей you.com стало подключение LLM к интернету, что позволяет системе предоставлять актуальные факты со ссылками на источники, повышая доверие к ответам.
🧠 Мультимодальность и «проблема холодного старта» 14:10
Одним из главных выводов Сочера стало понимание того, что текст — не всегда лучший способ передачи информации. Будущее ИИ-ассистентов, как полагает Сочер, должно быть мультимодальным.
- Интерактивность: При запросе биржевых данных платформа показывает не просто текст, а интерактивный тикер, позволяющий изучать графики в режиме реального времени прямо в окне чата.
- Экосистема приложений: Для решения проблемы расширения функциональности you.com запустила своеобразный «магазин приложений». Разработчики могут создавать мини-программы, которые встраиваются в результаты поиска или ответы чата.
- Дилемма платформы: Сочер признает наличие «проблемы холодного старта»: пользователи не придут на платформу без функционала, а разработчики не будут создавать приложения для платформы без широкой базы пользователей. В начале пути компания вынуждена создавать ключевые инструменты самостоятельно.
⚖️ Приватность, персонализация и границы ответственности 19:33
Вопрос конфиденциальности данных остается одним из самых острых в сфере ИИ. Хотя Сочер утверждает, что их команда стремится сделать you.com наиболее приватным решением на рынке, он признает сложности общения с аудиторией по этой теме.
- Реалии бизнеса: По словам Сочера, активная реклама принципов приватности не всегда приводит к быстрому росту бизнеса, что вынуждает компании балансировать между безопасностью данных и необходимостью аналитики для улучшения продукта.
- Персонализация: Существует тонкая грань между «умным» помощником, который знает контекст пользователя, и «пугающим» поведением ИИ. Сочер считает, что ИИ не должен навязывать персонализацию, если запрос пользователя носит чисто фактологический характер.
В недавних обновлениях вышли агенты (you agent), способные выполнять сложные задачи, такие как расчет ипотечных платежей или анализ загруженных пользователем файлов. Несмотря на энтузиазм, сам Дэвид Пирс отмечает, что современная технология еще далека от совершенства: модели всё еще склонны к ошибкам, «галлюцинациям» и не всегда правильно интерпретируют намерения человека.