# Ведущий Wes Roth: «Новая функция Google NotebookLM кажется нереальной»

Источник: https://www.youtube.com/watch?v=b7GJ45oKQww
Канал: Wes Roth
Опубликовано: 17.09.2024

---

Ведущий YouTube-канала Wes Roth представил обзор революционного обновления инструмента Google NotebookLM. Главная инновация — функция «Audio Overview», способная превращать сухие документы, PDF-файлы и ссылки в живой, эмоциональный аудио-подкаст с двумя ИИ-ведущими. Автор демонстрирует, как ИИ справляется с анализом сложнейших тем: от генерации игровых миров компанией Tencent до экономических прогнозов Ark Invest о массовом внедрении гуманоидных роботов.

## 🎙️ Революция в потреблении информации: Google NotebookLM
[[JUMP:0:00]]

Google выпустила обновление для своего инструмента NotebookLM, которое Уэс Рот называет «невероятным», хотя и признается, что испытывает смешанные чувства от того, насколько реалистичным стал ИИ [0:00]. Ранее NotebookLM позволял пользователям загружать документы и взаимодействовать с ними через текстовый чат, создавая резюме или планы презентаций [0:12]. 

Новая функция кардинально меняет подход:

*   Система генерирует полноценный подкаст с двумя ведущими (мужчиной и женщиной) [0:38].
*   На данный момент поддерживается только английский язык [0:38].
*   ИИ использует естественную дикцию, делает паузы, шутит и перебивает «собеседника», имитируя реальный человеческий диалог [0:52].
*   Качество аудио и проработка сценария позволяют слушать такие обзоры в машине или во время тренировки [7:36].

Уэс Рот подчеркивает, что для создания контента ему потребовалось лишь загрузить ссылки на исследования, а ИИ сам написал сценарий, озвучил его и структурировал информацию [1:19]. Чтобы сделать демонстрацию нагляднее, автор дополнил аудио-дорожку видео-аватарами из сервиса HeyGen [1:04].

## 🎮 GameGen-O: ИИ, создающий открытые миры на лету
[[JUMP:1:32]]

Первым примером работы новой функции стал разбор проекта GameGen-O от китайского гиганта Tencent. Эта технология способна генерировать игровые пространства и элементы геймплея с помощью нейросетей [1:32].

Ключевые технические подробности проекта:

*   **База данных OGameData:** ИИ обучался на массиве данных из 150 популярных игр различных жанров, что позволяет ему понимать логику построения игровых миров [2:39].
*   **Двухэтапное обучение:** сначала система изучает «грамматику» геймдизайна (движения персонажей, архитектуру уровней), а затем переходит к фазе выполнения инструкций [3:05].
*   **Творческий ремикс:** ИИ может по запросу создавать персонажей, напоминающих Геральта из «Ведьмака» или Робокопа, помещая их в нетипичные сеттинги, например, в фэнтезийный лес [3:31].

Уэс Рот обращает внимание на то, что ИИ не просто «накладывает» текстуры, а понимает взаимодействие объектов [4:21]. По его словам, при изменении освещения тени удлиняются корректно, а анимация лошади меняется в зависимости от типа поверхности [4:35]. Тем не менее, вопрос о том, способен ли ИИ на истинную оригинальность или он лишь мастерски комбинирует существующие элементы, остается открытым [3:55].

## 🤖 Экономика роботов: прогноз Ark Invest на $24 триллиона
[[JUMP:8:16]]

Вторая часть видео посвящена отчету аналитической компании Ark Invest о будущем гуманоидных роботов. ИИ-ведущие в подкасте обсуждают амбициозный тезис: роботы могут стать ключом к неограниченному экономическому росту [9:21].

Основные положения отчета Ark Invest:

*   **Рыночный потенциал:** по прогнозам компании, рынок гуманоидных роботов в производственном секторе США может достичь $24 трлн [9:36].
*   **Замещение труда:** утверждается, что если заменить роботами хотя бы половину рабочих на фабриках США, объем выпускаемой продукции останется прежним [9:50].
*   **Стоимость устройства:** Илон Маск и аналитики Ark Invest полагают, что в будущем робот может стоить «меньше, чем Tesla» — около $10 000–16 000 [10:56].

По мнению авторов отчета, компаниям станет выгодно внедрять роботов, как только их производительность окажется хотя бы на 5% выше, чем у человека, при годовой зарплате сотрудника в $40 000 [10:43].

## 🏭 Барьеры внедрения: почему роботы заменят не всех
[[JUMP:11:21]]

Несмотря на оптимизм аналитиков, ИИ-ведущие выделяют ряд факторов, которые замедляют «робо-революцию». Важнейшим из них является концепция «Labor Share» (доля затрат на оплату труда в общих расходах компании) [11:33].

Аргументы против немедленной тотальной автоматизации:

1.  **Специфика индустрии:** в производстве табака затраты на рабочую силу минимальны, поэтому роботы там не дадут большой экономии. В производстве одежды, где много ручного труда, выгода выше [13:06].
2.  **Размер бизнеса:** крупные автозаводы уже автоматизированы, но малый бизнес нуждается в «мастерах на все руки», в то время как нынешние роботы лучше справляются с узкими задачами [12:27].
3.  **Кризисные стимулы:** пандемии, проблемы с логистикой и нехватка рабочих рук заставляют компании инвестировать в автоматизацию даже при высоких первоначальных затратах [13:44].

Уэс Рот отмечает, что NotebookLM работает на удивление надежно: за время тестов он не обнаружил явных галлюцинаций или грубых ошибок в интерпретации данных [7:51]. Однако он предупреждает, что ИИ никогда не бывает точен на 100%, и данные всегда стоит перепроверять по ссылкам-аннотациям, которые инструмент заботливо предоставляет [5:52].