Как Сири Азут внедряет невидимый искусственный интеллект в платформу Sublime

Автоматически сгенерированный транскрипт выпуска подкаста The Vergecast открывает глубокую дискуссию о месте искусственного интеллекта в повседневных программных продуктах. Ведущий Дэвид Пирс общается с создательницей платформы Sublime Сири Азут, чтобы выяснить, как технологии могут помогать человеку в управлении знаниями, не лишая его контроля и индивидуальности. Вместо хайпа вокруг автономных ИИ-агентов собеседники предлагают взглянуть на «умную автоматизацию» и невидимые алгоритмы, которые служат расширению человеческого творческого потенциала.

📚 Что такое Sublime: библиотека смыслов против «циркового представления» 5:01

Развитие персонального менеджмента знаний (PKM) традиционно шло по пути усложнения структуры файлов и папок. Сири Азут изначально не планировала создавать очередной классический инструмент для заметок. По её словам, команда стремилась переосмыслить сам способ существования человека в интернете, предложив альтернативу бесконечной гонке за охватами. Платформа Sublime задумывалась как пространство для создания личных библиотек смыслов, которые при этом тонко переплетены с библиотеками других пользователей. Это позволяет находить неожиданные интеллектуальные связи и сохранять элемент случайного открытия (серендипности) без превращения процесса в социальное «цирковое представление».

По наблюдениям Дэвида Пирса, всех интернет-пользователей можно разделить на две категории:

Люди, которые интуитивно понимают ценность сохранения цитат, закладок и мимолетных мыслей, находя в этом процессе своеобразный терапевтический эффект.
Люди, искренне недоумевающие, зачем копить гигантские массивы текстового хаоса, к которому они больше никогда не вернутся.

Сири Азут соглашается с этим делением, подчеркивая, что долгое время инструменты архивации не приносили пользователю очевидной выгоды. Инвестиции времени в сохранение контента не окупались, оставляя человека с мертвым грузом старых закладок. Задача современных технологий — сделать так, чтобы даже одно сохраненное предложение открывало перед пользователем увлекательное интеллектуальное путешествие.

🤖 Три столпа продукта и концепция невидимого ИИ 7:50

Вектор развития многих современных ИТ-компаний диктуется не реальными болями пользователей, а модой на технологические тренды. Сири Азут критически относится к вопросам инвесторов об «ИИ-стратегии», сравнивая это с недавним бумом Web3-стартапов, когда за громкими вывесками часто отсутствовал жизнеспособный продукт. Философия Sublime строится вокруг четкого разделения задач на три ключевых этапа: сбор (collect), связывание (connect) и созидание (create).

На этапе сбора информации авторы Sublime сознательно отказываются от автоматизации. Сири Азут убеждена, что этот процесс должен управляться исключительно вкусом и личным суждением человека. Никакие алгоритмы, отслеживающие поведение пользователя в браузере, не способны понять, что именно имеет для него истинную ценность. Тем не менее, ИИ находит свое место на уровне утилит, где требуется механическая польза, а не человеческий выбор. Ярким примером служит функция «магии подкастов» (Podcast Magic), которая автоматизирует рутину, оставаясь абсолютно невидимой на посадочной странице сервиса. По мнению Сири Азут, долгая игра выигрывается не громкими заявлениями со сцены, а реальным решением проблем пользователя.

На этапе созидания (create) разработчики сталкиваются с серьезным вызовом — необходимостью дать пользователю полный контроль. Сири Азут считает, что популярный сегодня интерфейс чат-ботов (вроде ChatGPT) часто терпит неудачу, когда человеку требуется точечная доработка или ручное редактирование сгенерированного контента. ИИ как машина генерализации стремится свести уникальные источники пользователя к среднему арифметическому, что вызывает разочарование у творческих людей. Именно поэтому Sublime внедряет подобные функции созидания с крайней осторожностью.

🎙️ Podcast Magic: как превратить скриншот в инсайт 25:44

Дэвид Пирс разделяет оптимизм по поводу ИИ как прикладного инструмента, но скептически относится к попыткам превратить его в «образ жизни». Функция Podcast Magic родилась из повседневной человеческой привычки: слушая подкаст во время прогулки или тренировки, люди часто делают скриншот экрана телефона, чтобы запомнить умную мысль. Однако к этим изображениям в фотогалерее почти никто не возвращается.

Идея превратить этот костыль в элегантное решение пришла от одного из инженеров команды Sublime, Алекса. Техническая реализация идеи заняла около года из-за обилия скрытых деталей и пограничных сценариев. Сегодня процесс выглядит максимально просто для пользователя:

Пользователь делает скриншот экрана плеера или экрана блокировки во время прослушивания аудио.
Отправляет его в систему (или использует голосовую команду Siri).
В течение 30 секунд получает на почту точную текстовую транскрипцию момента, вокруг которого был сделан скриншот.

За этой простотой скрывается комплексная работа ИИ-моделей. Алгоритмы распознают изображение, определяют название подкаста, конкретный эпизод и временную метку. Затем система обращается к базе RSS-фидов, находит нужный аудиофрагмент и использует модель Whisper от OpenAI для высокоточной транскрипции. На финальном этапе языковая модель анализирует текст, чтобы определить логические границы разговора и вычленить его «сердце и душу». Для Sublime эта функция стала эффективным инструментом привлечения аудитории, демонстрирующим мгновенный «ага-эффект» без использования слова «ИИ» в маркетинговых материалах.

🔍 «Поиск по вайбу» и прорыв семантического извлечения 34:20

Опыт использования современных языковых моделей заставил Сири Азут пересмотреть ожидания от технологий. Она предлагает заменить концепцию автономных ИИ-агентов понятием «умной автоматизации». По её мнению, ИИ безупречен в четких, ограниченных правилами технических задачах (таких как транскрибирование аудио), но быстро ломается на размытых, субъективных процессах, составляющих большую часть реальной работы. Попытки автоматизировать, например, персонализированный аутрич к авторам подкастов через ИИ-агентов проваливаются, поскольку машина не способна учесть контекст конкретной платформы или стиля общения человека.

В то же время Дэвид Пирс убежден, что в области поиска ИИ совершил не 10-процентный, а 10-кратный прорыв (10x). Он сравнивает этот тектонический сдвиг с появлением Gmail: если раньше пользователям приходилось вручную раскладывать письма по папкам, то Gmail позволил просто архивировать всё подряд, полагаясь на строку поиска. Современный ИИ полностью избавляет человека от необходимости вести сложные системы тегов и блокнотов.

В Sublime этот подход называют «поиском по вайбу» (vibe search). Сири Азут объясняет, что пользователь может искать цитату, например, Андрея Карпатого, вообще не помня точных слов из его твита. Система использует семантические эмбеддинги, оценивая смысловую близость сохраненных карточек. По мнению создательницы Sublime, легендарный сервис Evernote десятилетней давности потерял актуальность именно потому, что отлично справлялся со сбором информации, но предлагал ужасные, жесткие механизмы её извлечения.

🧠 Риски для вкуса и личные ИИ-практики разработчиков 38:15

Оборотной стороной идеальных рекомендательных систем становится угроза нивелирования человеческого вкуса. Дэвид Пирс выражает опасение, что когда алгоритмы слишком хорошо угадывают наши желания, мы перестаем понимать происхождение своих предпочтений. В качестве примера он приводит TikTok, где контент беспрерывно «случается» с пользователем, размывая его активный выбор.

Сири Азут признает эту проблему, ссылаясь на теорию исследователя Кена Стэнли о работе алгоритмов социальных сетей. Если водитель на шоссе оборачивается посмотреть на автомобильную аварию, алгоритм трактует это как искреннюю любовь к катастрофам и начинает транслировать их всем вокруг. Философия рекомендации в Sublime иная: они используют низкий фиксированный порог популярности, чтобы намеренно продвигать неочевидный контент и заставлять пользователя соприкасаться со сложными, «неэффективными» культурными явлениями.

В личной жизни Сири Азут активно экспериментирует с инструментами искусственного интеллекта, проверяя их ограничения:

Голосовые прогулки: во время ходьбы она использует голосовой режим ChatGPT, наговаривая свои мысли в течение 10 минут, чтобы получить структурированную обратную связь, хотя и признает риск искусственной валидации со стороны послушной модели.
Быстрое прототипирование: использование инструмента V0 от Vercel позволяет ей создавать интерактивные интерфейсы вместо написания текстовых readme-файлов. По её мнению, один рабочий прототип заменяет сотню совещаний с инженерами.
Творческое замедление: вопреки тренду на скорость, ИИ помогает Сири писать дольше и качественнее, предлагая альтернативные комедийные или стилистические форматы для черновиков.

💡 Философия будущего: 99% вдохновения и 1% пота 46:37

Главный вызов технологической эпохи, по мнению собеседников, заключается не в том, что машины становятся похожими на людей, а в том, что люди добровольно превращаются в роботов. Повсеместная одержимость «казино продуктивности» и подборками в духе «10 способов повысить эффективность до 6 утра» заставляет человека оптимизировать себя под нужды алгоритмов.

Сири Азут предлагает перевернуть знаменитую формулу Томаса Эдисона. В мире, где ИИ берет на себя всю рутину и оптимизацию, формула успеха будет состоять из 99% вдохновения (inspiration) и лишь 1% пота (perspiration). Исторически человечество прошло через три ключевых этапа доминирования человеческих качеств:

Доиндустриальная эпоха, где определяющее значение имела физическая сила.
Информационный век, выдвинувший на первый план ментальную силу, интеллект и багаж накопленных фактов.
Эпоха ИИ, где главным преимуществом человека становится способность мечтать, чувствовать и соединяться со своим внутренним источником вдохновения.

Технологии сами по себе нейтральны. Человек может использовать ИИ для аутсорсинга своей агентности (слепо копируя сгенерированные ответы на письма) или для её расширения (используя машину как спарринг-партнера для размышлений). Основную проблему текущей индустрии Сири Азут видит в том, что лидеры ИИ-рынка мчатся к созданию AGI (общего искусственного интеллекта) в абсолютном смысловом вакууме. Они не могут ответить, сделает ли AGI человека более счастливым, улучшит ли это отношения в семье или качество родительства. Задача таких проектов, как Sublime, — заполнить этот вакуум созидательными, человекоцентричными сценариями будущего.