Как Сири Азут внедряет невидимый искусственный интеллект в платформу Sublime

The Vergecast 7,5 тыс. 52 мин 7 мин 07.12.2025
Главное

Автоматически сгенерированный транскрипт выпуска подкаста The Vergecast открывает глубокую дискуссию о месте искусственного интеллекта в повседневных программных продуктах. Ведущий Дэвид Пирс общается с создательницей платформы Sublime Сири Азут, чтобы выяснить, как технологии могут помогать человеку в управлении знаниями, не лишая его контроля и индивидуальности. Вместо хайпа вокруг автономных ИИ-агентов собеседники предлагают взглянуть на «умную автоматизацию» и невидимые алгоритмы, которые служат расширению человеческого творческого потенциала.

📚 Что такое Sublime: библиотека смыслов против «циркового представления» 5:01

Развитие персонального менеджмента знаний (PKM) традиционно шло по пути усложнения структуры файлов и папок. Сири Азут изначально не планировала создавать очередной классический инструмент для заметок. По её словам, команда стремилась переосмыслить сам способ существования человека в интернете, предложив альтернативу бесконечной гонке за охватами. Платформа Sublime задумывалась как пространство для создания личных библиотек смыслов, которые при этом тонко переплетены с библиотеками других пользователей. Это позволяет находить неожиданные интеллектуальные связи и сохранять элемент случайного открытия (серендипности) без превращения процесса в социальное «цирковое представление».

По наблюдениям Дэвида Пирса, всех интернет-пользователей можно разделить на две категории:

Сири Азут соглашается с этим делением, подчеркивая, что долгое время инструменты архивации не приносили пользователю очевидной выгоды. Инвестиции времени в сохранение контента не окупались, оставляя человека с мертвым грузом старых закладок. Задача современных технологий — сделать так, чтобы даже одно сохраненное предложение открывало перед пользователем увлекательное интеллектуальное путешествие.

🤖 Три столпа продукта и концепция невидимого ИИ 7:50

Вектор развития многих современных ИТ-компаний диктуется не реальными болями пользователей, а модой на технологические тренды. Сири Азут критически относится к вопросам инвесторов об «ИИ-стратегии», сравнивая это с недавним бумом Web3-стартапов, когда за громкими вывесками часто отсутствовал жизнеспособный продукт. Философия Sublime строится вокруг четкого разделения задач на три ключевых этапа: сбор (collect), связывание (connect) и созидание (create).

На этапе сбора информации авторы Sublime сознательно отказываются от автоматизации. Сири Азут убеждена, что этот процесс должен управляться исключительно вкусом и личным суждением человека. Никакие алгоритмы, отслеживающие поведение пользователя в браузере, не способны понять, что именно имеет для него истинную ценность. Тем не менее, ИИ находит свое место на уровне утилит, где требуется механическая польза, а не человеческий выбор. Ярким примером служит функция «магии подкастов» (Podcast Magic), которая автоматизирует рутину, оставаясь абсолютно невидимой на посадочной странице сервиса. По мнению Сири Азут, долгая игра выигрывается не громкими заявлениями со сцены, а реальным решением проблем пользователя.

На этапе созидания (create) разработчики сталкиваются с серьезным вызовом — необходимостью дать пользователю полный контроль. Сири Азут считает, что популярный сегодня интерфейс чат-ботов (вроде ChatGPT) часто терпит неудачу, когда человеку требуется точечная доработка или ручное редактирование сгенерированного контента. ИИ как машина генерализации стремится свести уникальные источники пользователя к среднему арифметическому, что вызывает разочарование у творческих людей. Именно поэтому Sublime внедряет подобные функции созидания с крайней осторожностью.

🎙️ Podcast Magic: как превратить скриншот в инсайт 25:44

Дэвид Пирс разделяет оптимизм по поводу ИИ как прикладного инструмента, но скептически относится к попыткам превратить его в «образ жизни». Функция Podcast Magic родилась из повседневной человеческой привычки: слушая подкаст во время прогулки или тренировки, люди часто делают скриншот экрана телефона, чтобы запомнить умную мысль. Однако к этим изображениям в фотогалерее почти никто не возвращается.

Идея превратить этот костыль в элегантное решение пришла от одного из инженеров команды Sublime, Алекса. Техническая реализация идеи заняла около года из-за обилия скрытых деталей и пограничных сценариев. Сегодня процесс выглядит максимально просто для пользователя:

  1. Пользователь делает скриншот экрана плеера или экрана блокировки во время прослушивания аудио.
  2. Отправляет его в систему (или использует голосовую команду Siri).
  3. В течение 30 секунд получает на почту точную текстовую транскрипцию момента, вокруг которого был сделан скриншот.

За этой простотой скрывается комплексная работа ИИ-моделей. Алгоритмы распознают изображение, определяют название подкаста, конкретный эпизод и временную метку. Затем система обращается к базе RSS-фидов, находит нужный аудиофрагмент и использует модель Whisper от OpenAI для высокоточной транскрипции. На финальном этапе языковая модель анализирует текст, чтобы определить логические границы разговора и вычленить его «сердце и душу». Для Sublime эта функция стала эффективным инструментом привлечения аудитории, демонстрирующим мгновенный «ага-эффект» без использования слова «ИИ» в маркетинговых материалах.

🔍 «Поиск по вайбу» и прорыв семантического извлечения 34:20

Опыт использования современных языковых моделей заставил Сири Азут пересмотреть ожидания от технологий. Она предлагает заменить концепцию автономных ИИ-агентов понятием «умной автоматизации». По её мнению, ИИ безупречен в четких, ограниченных правилами технических задачах (таких как транскрибирование аудио), но быстро ломается на размытых, субъективных процессах, составляющих большую часть реальной работы. Попытки автоматизировать, например, персонализированный аутрич к авторам подкастов через ИИ-агентов проваливаются, поскольку машина не способна учесть контекст конкретной платформы или стиля общения человека.

В то же время Дэвид Пирс убежден, что в области поиска ИИ совершил не 10-процентный, а 10-кратный прорыв (10x). Он сравнивает этот тектонический сдвиг с появлением Gmail: если раньше пользователям приходилось вручную раскладывать письма по папкам, то Gmail позволил просто архивировать всё подряд, полагаясь на строку поиска. Современный ИИ полностью избавляет человека от необходимости вести сложные системы тегов и блокнотов.

В Sublime этот подход называют «поиском по вайбу» (vibe search). Сири Азут объясняет, что пользователь может искать цитату, например, Андрея Карпатого, вообще не помня точных слов из его твита. Система использует семантические эмбеддинги, оценивая смысловую близость сохраненных карточек. По мнению создательницы Sublime, легендарный сервис Evernote десятилетней давности потерял актуальность именно потому, что отлично справлялся со сбором информации, но предлагал ужасные, жесткие механизмы её извлечения.

🧠 Риски для вкуса и личные ИИ-практики разработчиков 38:15

Оборотной стороной идеальных рекомендательных систем становится угроза нивелирования человеческого вкуса. Дэвид Пирс выражает опасение, что когда алгоритмы слишком хорошо угадывают наши желания, мы перестаем понимать происхождение своих предпочтений. В качестве примера он приводит TikTok, где контент беспрерывно «случается» с пользователем, размывая его активный выбор.

Сири Азут признает эту проблему, ссылаясь на теорию исследователя Кена Стэнли о работе алгоритмов социальных сетей. Если водитель на шоссе оборачивается посмотреть на автомобильную аварию, алгоритм трактует это как искреннюю любовь к катастрофам и начинает транслировать их всем вокруг. Философия рекомендации в Sublime иная: они используют низкий фиксированный порог популярности, чтобы намеренно продвигать неочевидный контент и заставлять пользователя соприкасаться со сложными, «неэффективными» культурными явлениями.

В личной жизни Сири Азут активно экспериментирует с инструментами искусственного интеллекта, проверяя их ограничения:

💡 Философия будущего: 99% вдохновения и 1% пота 46:37

Главный вызов технологической эпохи, по мнению собеседников, заключается не в том, что машины становятся похожими на людей, а в том, что люди добровольно превращаются в роботов. Повсеместная одержимость «казино продуктивности» и подборками в духе «10 способов повысить эффективность до 6 утра» заставляет человека оптимизировать себя под нужды алгоритмов.

Сири Азут предлагает перевернуть знаменитую формулу Томаса Эдисона. В мире, где ИИ берет на себя всю рутину и оптимизацию, формула успеха будет состоять из 99% вдохновения (inspiration) и лишь 1% пота (perspiration). Исторически человечество прошло через три ключевых этапа доминирования человеческих качеств:

  1. Доиндустриальная эпоха, где определяющее значение имела физическая сила.
  2. Информационный век, выдвинувший на первый план ментальную силу, интеллект и багаж накопленных фактов.
  3. Эпоха ИИ, где главным преимуществом человека становится способность мечтать, чувствовать и соединяться со своим внутренним источником вдохновения.

Технологии сами по себе нейтральны. Человек может использовать ИИ для аутсорсинга своей агентности (слепо копируя сгенерированные ответы на письма) или для её расширения (используя машину как спарринг-партнера для размышлений). Основную проблему текущей индустрии Сири Азут видит в том, что лидеры ИИ-рынка мчатся к созданию AGI (общего искусственного интеллекта) в абсолютном смысловом вакууме. Они не могут ответить, сделает ли AGI человека более счастливым, улучшит ли это отношения в семье или качество родительства. Задача таких проектов, как Sublime, — заполнить этот вакуум созидательными, человекоцентричными сценариями будущего.

💬 Цитаты

«Я заменила концепцию ИИ-агентов подходом умной автоматизации — так вы получаете меньше разочарований.»

Сири Азут 34:46

«Evernote десять лет назад был малополезен, потому что сбор данных работал, а извлечение было ужасным.»

Сири Азут 37:37
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
PKM (Personal Knowledge Management)
Система персонального управления знаниями, помогающая собирать, структурировать и находить личную информацию.
Эмбеддинг (Embedding)
Векторное представление текста, позволяющее алгоритмам ИИ оценивать смысловую близость разных фрагментов данных.
Семантический поиск
Поиск по смыслу и контексту, а не по точному совпадению букв или ключевых слов.
AGI (Artificial General Intelligence)
Гипотетический искусственный интеллект общего уровня, способный выполнять любую интеллектуальную задачу на уровне человека.
📊 Цифры
🗓 Хронология
  1. Прошлое (Доиндустриальная эпоха) Период, когда ключевым конкурентным преимуществом человека и основой выживания являлась его физическая сила.
  2. Информационный век Эпоха развития технологий знаний, где главной ценностью стала ментальная сила, интеллект и эрудиция.
  3. Эпоха ИИ (Настоящее и будущее) Переход к автоматизации рутины, где главным преимуществом человека становится способность мечтать и вдохновляться.
⚖️ Другая сторона
Искусственный интеллект Sublime Сири Азут Дэвид Пирс Podcast Magic семантический поиск