Корпорация Google представила инструмент NotebookLM, который способен превратить любой документ, таблицу или ссылку в полноценный подкаст с двумя «ведущими». В новом выпуске The Vergecast Эндрю Эдвардс и команда экспертов разбираются, станет ли эта технология закатом профессионального подкастинга или она лишь создает новый, сугубо утилитарный способ потребления информации.
🎙️ Искусство имитации: Как работает «Audio Overview» 0:39
В основе новой функции лежит инструмент Google NotebookLM, использующий модель Gemini 1.5 Pro . Его ключевая особенность — функция Audio Overview («Аудио-обзор»), которая не просто зачитывает текст робоголосом, а создает имитацию живого обсуждения. Алгоритм анализирует загруженные источники, выстраивает логику повествования, добавляет метафоры, уместные шутки и даже специфические для подкастов «слова-паразиты» (вроде «гм» или «знаете ли») .
Для достижения такой реалистичности Google использовала несколько методов:
- Мета-промптинг и агентные рабочие процессы: AI самостоятельно пишет сценарий, распределяя роли между двумя ведущими .
- Обучение на реальных данных: Саймон Токамин, директор по продукту NotebookLM, отметил, что команда записывала часы диалогов реальных людей, чтобы передать естественную химию и манеру живого общения в студии .
- Контекстуализация: AI способен не только пересказывать текст, но и дополнять его внешними знаниями. Например, при анализе рецепта паэльи ведущие начали спорить о текстуре риса, упомянув ризотто, хотя в исходном тексте ризотто не упоминалось .
🛠️ Практическое применение: От обзора iPhone до отзывов начальства 1:43
Эндрю Эдвардс протестировал инструмент на разных типах документов. По его мнению, формат подкаста делает «неудобную» или скучную информацию более удобоваримой .
Примеры использования:
- Рабочие аттестации (Performance Review): Эндрю загрузил свой отзыв о работе от руководства. По его признанию, слушать критику в формате подкаста психологически легче, чем читать её в документе .
- Технические инструкции: Сложное руководство к стереоресиверу Outlaw RR 2160 MK2 превратилось в понятный разговор о портах USB и драйверах для Windows .
- Рецепты: Сухой перечень ингредиентов стал живым обсуждением вкусовых нюансов испанской кухни .
Однако автор выявил и забавный парадокс «эффективности». Когда он загрузил видеообзор iPhone 16 Pro длительностью 22 минуты, AI превратил его в 20-минутный подкаст. «Сэкономил мне целые две минуты», — иронизирует Эдвардс . Саймон Токамин пояснил, что это осознанное решение: тестеры из Google просили делать подкасты максимально информативными и короткими, но остальным пользователям больше понравился формат «Lean Back» — когда информацию можно слушать расслабленно, как фоновый шум .
❌ Иллюзия профессионализма: Ошибки и галлюцинации 7:44
Несмотря на внешнюю эффектность, профессиональные продюсеры The Verge нашли в работе AI серьезные изъяны. Дэвид Пирс и продюсеры шоу Decoder Кейт Кокс и Ник Статт сошлись во мнении, что продукт Google пока лишь имитирует форму, но не содержание .
Основные претензии экспертов:
- Отсутствие выводов: AI-ведущие отлично выделяют интересные факты, но не могут связать их в глубокий анализ. По выражению Дэвида Пирса, это «начало хорошего подкаста, в котором забыли сделать сам подкаст» .
- Избыток каламбуров: Роботы слишком стараются казаться людьми и вставляют плоские шутки (например, про «заряженные дебаты» в теме об электромобилях) в таких количествах, которые нормальный человек бы не использовал .
- Галлюцинации и фактические ошибки: Инструмент неправильно интерпретировал структуру документа и приписал СЕО Shopify Тоби Лютке цитату из вложенной ссылки, которая на самом деле ему не принадлежала . Также AI упорно отказывался признавать ошибку в определении пола ведущего Нилая Пателя, называя его «она» даже после прямого исправления пользователем .
🤖 Интерактивное будущее и угроза рынку 11:06
Одной из самых перспективных функций Эдвардс назвал «Интерактивный режим». В нем пользователь может прервать подкаст вопросом, и AI мгновенно перестроит диалог. Например, если в рецепте нет нужных ингредиентов, ведущие тут же предложат замену (тофу вместо курицы) и продолжат обсуждение .
Что касается будущего индустрии, мнения разделились:
- Николас Куа (подкаст-критик Vulture) считает, что под угрозой в первую очередь находятся формульные жанры: сводки погоды, трафика и короткие новости на радио. Эти форматы настолько шаблонны, что AI легко их симулирует .
- Эндрю Эдвардс и Дэвид Пирс полагают, что NotebookLM не является прямым конкурентом авторским шоу. Это скорее «утилитарная версия вселенной», которая помогает быстро усвоить материал одному конкретному человеку .
- По мнению авторов, засилье AI-контента может привести к обратному эффекту: люди начнут больше ценить человеческий труд и уникальный взгляд авторов, который невозможно сгенерировать одной кнопкой .
В завершение Эдвардс отметил, что прослушивание AI-версий собственных материалов помогает ему увидеть профессиональные штампы со стороны. «Возможно, мы станем создавать более вдумчивое искусство благодаря тому, что слышим от искусственного контента», — заключает он .