Стивен Джонсон о Google NotebookLM: «ИИ как личный наставник»

The Vergecast 10,9 тыс. 57 мин 3 мин 22.09.2024
Главное

Искусственный интеллект как персональный наставник: история создания Google NotebookLM 🧠 0:01

В первом выпуске новой серии подкаста The Vergecast, посвященной влиянию искусственного интеллекта на повседневную жизнь, ведущий Дэвид Пирс беседует с автором 14 книг и сотрудником Google Стивеном Джонсоном. Главной темой обсуждения стал проект NotebookLM — экспериментальный инструмент от Google Labs, который, по словам Джонсона, представляет собой «инструмент для понимания вещей».

🛠 От личного архива к продукту Google 3:32

Стивен Джонсон, известный своими трудами в области науки и истории, давно интересовался использованием технологий для структурирования процесса мышления и исследований. Еще в 2022 году он опубликовал статью о языковых моделях, где утверждал, что они способны радикально изменить творческий процесс, несмотря на скептицизм критиков.

Вскоре после этого его пригласили в команду Google Labs. Концепция подразделения заключалась в создании «быстрых и гибких» экспериментов с новыми технологиями. Особенностью подхода стало «сотворчество» с экспертами извне: Джонсон стал своего рода «подопытным», помогая разработчикам создать идеальный софт для работы с информацией, о котором он мечтал еще в студенческие годы.

Ключевые принципы NotebookLM:

🤖 Gemini и прорыв в работе с контекстом 12:12

Переход NotebookLM на модель Gemini 1.5 Pro с увеличенным контекстным окном стал поворотным моментом. Джонсон отмечает, что способность модели «видеть» огромные объемы данных целиком — например, миллион слов из архивов NASA — позволяет находить неочевидные связи, которые человек собирал бы неделями.

По мнению Джонсона, метафора «понимания» здесь не совсем уместна, так как речь идет не об обретении системой сознания, а о способности ИИ видеть весь массив информации одновременно. Примечательно, что модель не пытается притворяться человеком, а честно признается, если не может ответить на вопрос, основываясь на предоставленных данных.

🎙 Аудиообзоры: «Две нейросети в моих ушах» 39:46

Одной из самых обсуждаемых функций стали «аудиообзоры» — генерация 10-минутного подкаста, где два ИИ-ведущих обсуждают загруженные документы. Изначально, по словам Джонсона, создатели стремились к «беспристрастному» стилю общения системы, но для аудиоформата потребовалось добавить человеческие эмоции, «разговорную небрежность» и даже легкие споры.

Джонсон подчеркивает, что это не просто игрушка, а способ обучения для тех, кто лучше воспринимает информацию на слух. Кроме того, это открывает возможность создания контента на узкоспециализированные темы, которые никогда не стали бы коммерчески успешными подкастами — например, подробный разбор кампании Dungeons & Dragons.

⚖️ Ответственность и будущее ИИ-инструментов 35:45

Вопрос о том, не является ли использование ИИ «читерством» в учебе или работе, остается открытым. Джонсон считает, что все зависит от намерений пользователя:

Дэвид Пирс отмечает, что инструменту критически не хватает функций мультимедийного поиска (например, чтобы ИИ сам предлагал видео или подкасты по теме). Стивен Джонсон подтверждает, что команда осознает необходимость помощи пользователям в поиске информации, а не только в ее обработке, и намекает на возможные обновления в 2025 году.

💬 Цитаты

«Это не инструмент для создания контента, а инструмент для понимания вещей.»

Стивен Джонсон 01:46

«Если вы идете в это с хорошими намерениями, это потрясающий инструмент для мышления.»

Стивен Джонсон 35:45
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Source Grounding
Технология ограничения ответов ИИ рамками предоставленных пользователем источников данных.
RAG (Retrieval-Augmented Generation)
Метод, при котором языковая модель обращается к внешним базам данных для получения актуальной или специфической информации.
Контекстное окно
Объем информации, который модель может «удерживать в памяти» и обрабатывать за один раз.
📊 Цифры
🗓 Хронология
  1. 1980-е Стивен Джонсон начинает искать инструменты для помощи в написании текстов.
  2. Весна 2022 Джонсон пишет статью о языковых моделях для Times Magazine.
  3. Август 2022 Первая версия прототипа (проект Tailwind) начала работать в Google.
  4. Декабрь 2023 Переход NotebookLM на модель Gemini 1.0.
  5. 2025 Ожидаемое появление функций поиска информации в интернете внутри NotebookLM.
⚖️ Другая сторона
Искусственный интеллект Google NotebookLM Steven Johnson Gemini 1.5 Pro Source Grounding Google Labs