Искусственный интеллект как персональный наставник: история создания Google NotebookLM 🧠 0:01
В первом выпуске новой серии подкаста The Vergecast, посвященной влиянию искусственного интеллекта на повседневную жизнь, ведущий Дэвид Пирс беседует с автором 14 книг и сотрудником Google Стивеном Джонсоном. Главной темой обсуждения стал проект NotebookLM — экспериментальный инструмент от Google Labs, который, по словам Джонсона, представляет собой «инструмент для понимания вещей».
🛠 От личного архива к продукту Google 3:32
Стивен Джонсон, известный своими трудами в области науки и истории, давно интересовался использованием технологий для структурирования процесса мышления и исследований. Еще в 2022 году он опубликовал статью о языковых моделях, где утверждал, что они способны радикально изменить творческий процесс, несмотря на скептицизм критиков.
Вскоре после этого его пригласили в команду Google Labs. Концепция подразделения заключалась в создании «быстрых и гибких» экспериментов с новыми технологиями. Особенностью подхода стало «сотворчество» с экспертами извне: Джонсон стал своего рода «подопытным», помогая разработчикам создать идеальный софт для работы с информацией, о котором он мечтал еще в студенческие годы.
Ключевые принципы NotebookLM:
- Обоснование источниками (Source Grounding): Модель работает исключительно на базе документов или ссылок, загруженных пользователем.
- Доверие: Ответы системы всегда сопровождаются ссылками на исходный материал для проверки фактов.
- Фокус на понимании: Цель инструмента — не просто «галлюцинировать», а помочь пользователю глубоко разобраться в собственном массиве данных.
🤖 Gemini и прорыв в работе с контекстом 12:12
Переход NotebookLM на модель Gemini 1.5 Pro с увеличенным контекстным окном стал поворотным моментом. Джонсон отмечает, что способность модели «видеть» огромные объемы данных целиком — например, миллион слов из архивов NASA — позволяет находить неочевидные связи, которые человек собирал бы неделями.
По мнению Джонсона, метафора «понимания» здесь не совсем уместна, так как речь идет не об обретении системой сознания, а о способности ИИ видеть весь массив информации одновременно. Примечательно, что модель не пытается притворяться человеком, а честно признается, если не может ответить на вопрос, основываясь на предоставленных данных.
🎙 Аудиообзоры: «Две нейросети в моих ушах» 39:46
Одной из самых обсуждаемых функций стали «аудиообзоры» — генерация 10-минутного подкаста, где два ИИ-ведущих обсуждают загруженные документы. Изначально, по словам Джонсона, создатели стремились к «беспристрастному» стилю общения системы, но для аудиоформата потребовалось добавить человеческие эмоции, «разговорную небрежность» и даже легкие споры.
Джонсон подчеркивает, что это не просто игрушка, а способ обучения для тех, кто лучше воспринимает информацию на слух. Кроме того, это открывает возможность создания контента на узкоспециализированные темы, которые никогда не стали бы коммерчески успешными подкастами — например, подробный разбор кампании Dungeons & Dragons.
⚖️ Ответственность и будущее ИИ-инструментов 35:45
Вопрос о том, не является ли использование ИИ «читерством» в учебе или работе, остается открытым. Джонсон считает, что все зависит от намерений пользователя:
- Добросовестное использование: Если ИИ помогает сэкономить время на рутине и углубить понимание материала — это «огромный позитив».
- Иллюзия знаний: Если цель — лишь создать видимость экспертности, не вникая в суть, это опасная стратегия, которая в конечном итоге ведет к провалу.
Дэвид Пирс отмечает, что инструменту критически не хватает функций мультимедийного поиска (например, чтобы ИИ сам предлагал видео или подкасты по теме). Стивен Джонсон подтверждает, что команда осознает необходимость помощи пользователям в поиске информации, а не только в ее обработке, и намекает на возможные обновления в 2025 году.