NLP без текста, тайны TikTok и Юрген Шмидхубер против всех в новом выпуске ML News

Yannic Kilcher 17,1 тыс. 25 мин 5 мин 16.09.2021
Главное

В новом выпуске ML News Янник Килчер, популярный исследователь и популяризатор машинного обучения, разбирает последние достижения в области ИИ: от способности роботов-пылесосов распознавать продукты жизнедеятельности домашних животных до амбициозных заявлений Юргена Шмидхубера о приоритете его исследований над всеми современными архитектурами. Масштаб выпуска охватывает как фундаментальные прорывы в NLP от Facebook AI, так и курьезные случаи применения нейросетей в искусстве и маркетинге.

🎙️ NLP без текста: Новая эра аудиомоделей от Facebook AI 2:44

Подразделение Facebook AI (ныне Meta) опубликовало серию работ, посвященных концепции «NLP без текста» (Textless NLP) . Традиционные системы голосового управления и синтеза речи всегда использовали промежуточное звено — текст. Сначала звук переводился в слова (ASR), затем текст обрабатывался моделью, и результат снова синтезировался в голос (TTS). Facebook предложил отказаться от этого посредника.

Основные технические особенности системы:

По мнению Килчера, это открывает огромные возможности для редактирования речи: можно изменить ритм или интонацию фразы, сохранив голос автора, или заставить человека «говорить» на другом языке с его оригинальной манерой . Кроме того, модель способна продолжать начатую аудиозапись, выступая в роли полноценной языковой модели для звука, что приближает ИИ к выполнению обещаний «глубокого обучения» в области аудио .

🏛️ Юрген Шмидхубер: «Всё придумано в моей лаборатории» 5:32

Известный ученый Юрген Шмидхубер опубликовал новый пост под заголовком «Самые цитируемые нейросети построены на работах моей лаборатории» . В тексте он утверждает, что практически все современные архитектуры нейросетей имеют корни в его исследованиях десятилетней давности.

Кичлер отмечает, что Шмидхубер действительно является пионером в индустрии, и многие его утверждения имеют под собой фактическую основу — он часто предлагал идеи раньше своего времени . Однако, по мнению ведущего, автор часто заходит слишком далеко в своих претензиях:

Килчер иронизирует над стилем подачи материала, но признает вклад Шмидхубера в борьбу за справедливость в цитировании научных работ .

📱 Секреты алгоритмов: TikTok и депрессивные «кроличьи норы» 7:58

Издание Wall Street Journal провело расследование работы алгоритмов TikTok . Исследователи создали десятки ботов, которые имитировали интересы реальных пользователей. Выяснилось, что алгоритм невероятно быстро определяет предпочтения и начинает сужать выдачу, погружая пользователя в специфическую тему.

В качестве примера приводится контент о депрессии: если пользователь задерживает взгляд на таких видео, алгоритм начинает лавинообразно предлагать похожие ролики, фактически изолируя пользователя в негативном информационном пузыре . По мнению Килчера, TikTok — это «алгоритм YouTube на стероидах» . Ведущий жалуется, что ранний YouTube позволял «теряться» в темах через рекомендации в боковой панели, тогда как современные системы максимизируют вовлеченность (engagement) в ущерб пользовательскому опыту, предлагая лишь то, что пользователь уже гарантированно любит .

💩 Roomba против экскрементов и ИИ для аутентификации картин 10:45

Компания iRobot выпустила новую версию пылесоса Roomba, оснащенную ИИ для распознавания экскрементов домашних животных . Проблема «размазывания» фекалий по всему дому оказалась настолько серьезной, что инженеры годами обучали камеру на базе тысяч фотографий и макетов из пластилина . iRobot настолько уверена в системе, что обещает замену пылесоса, если он не справится с задачей .

Другой пример прикладного ИИ — адвокат-самоучка обучил сверточную нейросеть (CNN) отличать подлинники картин от подделок .

🏢 Интриги DeepMind и «демократизация» от экс-гуглеров 14:56

В СМИ появились подробности о стремлении DeepMind к независимости от Google . По данным Business Insider, руководство лаборатории пыталось создать некоммерческую структуру, чтобы контролировать созданный ими ИИ. Килчер относится к этому скептически: «Вы взяли деньги — вы продали компанию» . Он также критикует DeepMind за чрезмерную секретность, отмечая, что лаборатория редко делится кодом и моделями (за исключением AlphaFold), что противоречит их заявлениям о благе для человечества .

Одновременно с этим бывшие сотрудники Google основали стартап Cohere, собрав $40 млн инвестиций при поддержке Джеффри Хинтона и Фей-Фей Ли . Цель — «демократизация» NLP, хотя на практике это выглядит как очередной закрытый API по аналогии с OpenAI .

⚖️ Права ИИ-изобретателей и будущее найма 16:55

Американский суд постановил, что изобретателем в патенте может быть указано только «физическое лицо», но не система ИИ . Это решение противоречит практике ЮАР и Австралии, где подобные патенты были приняты. Стивен Талер, автор системы-изобретателя, намерен продолжать борьбу, по его словам, ради защиты прав машин от присвоения их заслуг людьми .

В завершение выпуска Янник обсуждает проблему автоматизированного найма:

💬 Цитаты

«Вы взяли деньги — вы продали компанию. Я не верю во всю эту чепуху про интересы человечества от одной из самых скрытных лабораторий.»

Янник Килчер 15:46

«Проблема автоматизированного найма решена будет не отменой технологий, а их улучшением.»

Янник Килчер 25:02
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
VQ-VAE
Вариационный автокодировщик с векторным квантованием, используемый для сжатия и представления дискретных данных.
GAN
Генеративно-состязательная сеть, состоящая из генератора и дискриминатора, конкурирующих друг с другом.
ASR
Автоматическое распознавание речи (перевод звука в текст).
TTS
Синтез речи из текста (Text-to-Speech).
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Facebook AI DeepMind TikTok Roomba Юрген Шмидхубер