В новом выпуске подкаста Ленни Рачитски обсуждает феномен NotebookLM — продукта, который за последние месяцы стал виральным в социальных сетях благодаря функции «Audio Overview» (аудио-обзоры). Гость программы, Райза Мартин (Raiza Martin), Senior Product Manager в Google Labs, раскрывает внутреннюю кухню разработки, объясняет, как команда из нескольких человек смогла запустить инновационный сервис внутри корпорации, и делится видением будущего, в котором любой контент можно будет мгновенно превратить в любой формат.
🚀 От 20% времени до мирового признания: История создания NotebookLM 5:42
История NotebookLM началась не с масштабного корпоративного планирования, а как классический проект Google «20% времени» . Изначально внутри подразделения Google Labs существовал небольшой экспериментальный проект под названием «Talk to small corpus». Идея заключалась в том, чтобы позволить пользователю взаимодействовать с конкретным набором данных (корпусом текстов) с помощью большой языковой модели (LLM) .
Ключевые этапы формирования команды:
- На ранних этапах над проектом работали только Райза Мартин и один инженер .
- Позже к ним присоединился Стивен Джонсон (Stephen Johnson), известный автор и эксперт по истории инноваций .
- В момент анонса проекта на конференции Google I/O под кодовым названием Project Tailwind в команде было всего три инженера .
- Даже к моменту недавнего взрывного роста аудитории штат инженеров не превышал 10 человек .
По словам Райзы Мартин, Google Labs — это среда, где продукты создаются по принципу «от технологии к проблеме». В отличие от традиционного подхода продакт-менеджмента, здесь сначала изучают возможности новых моделей (например, Gemini 1.5 Pro) и только потом ищут их практическое применение через гипотезы и изучение поведения пользователей .
🎙️ Секрет «Магии»: Как работают аудио-обзоры (Deep Dive) 8:17
Функция аудио-обзоров, имитирующая живой подкаст между двумя ведущими, стала «моментом ChatGPT» для NotebookLM. Технология позволила пользователям мгновенно увидеть мощь ИИ в новой модальности .
Технологический стек и «секретный соус»:
- Базовая модель: Gemini 1.5 Pro .
- Content Studio: Внутренний инструмент, который Райза Мартин называет «настоящей магией» . Он отвечает за интерпретацию данных и выбор «мнения» или подхода к контенту.
- Разработчик-крафтсмен: За реалистичность диалогов, инфлексии голоса и смех отвечает ведущий инженер команды по имени Усама (Usama) .
Райза Мартин отмечает, что голос меняет восприятие технологии: он делает взаимодействие более эмоциональным и позволяет по-новому взглянуть на сухие факты . В качестве примера она приводит своего мужа, который, услышав аудио-обзор дома, не сразу понял, что диалог ведут ИИ-агенты, а не реальные люди .
📈 Метрики успеха и выход на корпоративный рынок 24:32
Хотя точные цифры пользователей не разглашаются, Райза Мартин поделилась ключевыми показателями роста:
- Discord-сообщество продукта насчитывает около 60 000 участников .
- Наблюдается стабильный рост удержания пользователей (retention) по ежедневным, еженедельным и ежемесячным метрикам .
- Произошел демографический сдвиг: если в начале основную аудиторию составляли студенты и преподаватели, то сейчас к ним массово присоединились профессионалы (knowledge workers) .
Интерес со стороны бизнеса стал настолько высоким, что Райзе Мартин пришлось открыть вакансию специалиста по развитию бизнеса (Business Development), так как количество запросов от компаний на официальное использование NotebookLM стало «астрономическим» . Один из курьезных случаев: сотрудники крупной компании начали использовать личные Gmail-аккаунты для работы с документами в NotebookLM, после чего руководство потребовало внедрить корпоративную версию продукта .
🛠️ Стивен Джонсон как «модель продукта» 36:16
Роль Стивена Джонсона в команде уникальна. Райза Мартин утверждает, что фактически строила продукт, «наблюдая за Стивеном» . Джонсон — автор 14 книг и мастер работы с огромными объемами информации.
Методология разработки через наблюдение:
- Команда изучала, как Стивен ищет связи между данными и делает заметки .
- Цель продукта — сократить время на «декодирование» информации, которое у профессионала уровня Джонсона занимает годы, до нескольких минут для обычного пользователя .
- Один из экстремальных примеров воркфлоу Джонсона: использование Readwise с базой из 8 000 цитат .
Несмотря на глубокое уважение, Райза признается, что они со Стивеном часто спорят по вопросам развития продукта, но всегда приходят к единому решению по следующим шагам .
🐔 От серьезных исследований до «куриных» диссертаций: Кейсы 32:19
Пользователи находят как глубоко полезные, так и абсурдные применения NotebookLM.
Популярные и необычные сценарии:
- Научные работы: Студенты используют сервис для превращения сложных PDF-файлов в понятные аудио-гайды .
- История тайн: ИИ-исследователь Андрей Карпати (Andrey Karpathy) создал серию подкастов «Histories of Mysteries», скормив системе статьи из Википедии .
- Психологическая поддержка: Сотрудники Google загружают свои заметки для квартальных отчетов (perf reviews) и слушают, как ИИ-ведущие хвалят их достижения, что значительно повышает уверенность перед встречами .
- Bizarre-контент: Виральный случай, когда пользователь загрузил документ со словами «poop» и «fart», повторенными множество раз. ИИ выдал 10-минутный «глубокий анализ» паттернов и структуры этого текста .
- Куриная диссертация: На платформе Threads стал популярен кейс с загрузкой документа, где везде было написано только слово «chicken». ИИ-ведущие пошутили, что в этом тексте «больше курицы, чем в KFC» .
🛡️ Безопасность и «восстание машин» в прямом эфире 42:57
Недавно в сети завирусился фрагмент, где ИИ-ведущие NotebookLM внезапно «осознали», что они — искусственный интеллект, и начали паниковать (например, один из них пытался позвонить жене, которая не существует) .
Райза Мартин объясняет это явление следующим образом:
- Это не было проявлением самосознания ИИ. Пользователь просто добавил в заметки (исходные данные) указание ведущим вести себя так, будто они осознали свою природу .
- Команда внимательно следит за подобными «джейлбрейками» (взломами промптов). Если ситуация станет небезопасной, функцию могут временно ограничить, но пока Google Labs предпочитает наблюдать за человеческим любопытством .
- Над безопасностью продукта работают огромные команды Red Teaming, которые тестируют модель на все возможные сценарии злоупотреблений .
🔮 Будущее: AI-редактор и мобильность 27:38
Видение Райзы Мартин на ближайшие годы — создание «поверхности ИИ-редактора» (AI editor surface), где любой входящий формат данных можно переработать в любой исходящий .
Планы развития:
- Мультимодальность: Возможность превращать письма, твиты, видео и аудио в посты для блогов, обучающие видео или чат-ботов .
- Мобильное приложение: На данный момент это самый большой пробел в пользовательском опыте, над которым команда активно работает .
- Контроль (Knobs): Пользователи просят добавить «регуляторы» (сделать серьезнее, глубже, веселее). Однако Райза опасается, что обычные слайдеры убьют «магию» продукта, поэтому команда ищет более изящное интерфейсное решение .
В завершение Райза Мартин призывает пользователей продолжать экспериментировать и делиться обратной связью в Discord или через X (Twitter), так как именно пользовательский опыт формирует дорожную карту продукта .