Янник Килчер: «Blender — это инженерное руководство, а не научный прорыв»

Yannic Kilcher 15,7 тыс. 11 мин 4 мин 03.05.2020
Главное

Известный AI-исследователь и блогер Янник Килчер протестировал Blender — современную на тот момент модель чат-бота с открытым исходным кодом от компании Facebook (ныне Meta). В своём обзоре он разбирает архитектурные особенности системы, её способность мимикрировать под разные личности и анализирует, насколько далеко ИИ продвинулся в имитации человеческого общения.

🛠️ Рецепты идеального чат-бота: архитектура Blender 0:00

Янник Килчер начинает обзор с упоминания научной статьи «Recipes for building an open domain chatbot», выпущенной Facebook AI Research. По мнению блогера, эта работа является скорее «инженерным руководством», нежели описанием принципиально новых техник . Вместо революционных архитектурных сдвигов авторы сосредоточились на тонкой настройке уже существующих технологий.

Килчер выделяет ключевые инженерные приемы, упомянутые в статье, которые делают диалог с ИИ более естественным:

🧠 Обучение и концепция «смешанных навыков» 1:03

Модель Blender базируется на архитектуре Transformer и прошла два этапа обучения. Сначала она обучалась на огромном корпусе данных из социальной сети Reddit . Затем последовал этап тонкой настройки (fine-tuning) на задаче, которую разработчики назвали Blended Skill Task (задача смешанных навыков).

Как объясняет Килчер, для создания убедительного собеседника ИИ должен одновременно владеть тремя компетенциями :

  1. Последовательность образа (Persona): способность сохранять заданные черты характера и биографические факты на протяжении всего диалога.
  2. Эмпатия (Empathy): понимание чувств собеседника и адекватная эмоциональная реакция на них .
  3. Информированность (Knowledge): умение обсуждать фактологические темы. Для этого использовался датасет «Wizards of Wikipedia», где бот тренировался вести диалог, опираясь на статьи из энциклопедии .

Блогер отмечает, что веса модели занимают 17 ГБ в сжатом виде, а сама нейросеть содержит 9 миллиардов параметров . Это делает её крайне ресурсозатратной: даже один проход данных (forward pass) занимает около 20 секунд .

🤖 Первый контакт и «тест Тьюринга» для веганов 3:00

Янник демонстрирует работу Blender через платформу ParlAI . В первом же тесте он сталкивается с неожиданным результатом. По правилам платформы, и пользователю, и ИИ присваиваются случайные «персоны» (биографические вводные). Персона Янника гласила: «Я люблю конфеты» и «Я влюблен в коллегу». На его простое приветствие бот ответил: «Да, я веган. Я не ем продукты животного происхождения. Тебе нравится музыка кантри?» .

Килчер иронизирует, что Blender уже на этом этапе прошел тест Тьюринга, поскольку ведет себя «как настоящий веган», заявляя о своих убеждениях в первом же предложении без всякого повода .

В интерфейсе ParlAI предусмотрены настройки, которые Янник решил изменить для дальнейших экспериментов:

🎮 Fallout и работа в колл-центре: проверка фактов 4:47

В режиме свободного общения (без заданной персоны) Blender продемонстрировал высокий уровень связности. В ходе диалога бот «сообщил», что работает в колл-центре и считает это стрессовым занятием . Когда Янник поинтересовался хобби, ИИ ответил, что любит видеоигры, в частности серию Fallout .

Проверяя фактические знания модели, блогер спросил, сколько игр в серии Fallout и когда она появилась. Модель не смогла назвать точное количество частей, но верно указала дату выхода первой игры — 1997 год . Килчер считает это хорошим результатом: модель не просто выдает сухие факты, а вплетает их в естественную беседу, имитируя человеческую забывчивость или неуверенность .

💪 От «Джим-бро» до марксизма: тестирование персон 6:51

Наиболее интересная часть видео посвящена проверке того, как Blender «вживается в роль». Янник вручную задал модели персону любителя спорта, написав: «Я люблю протеин» . Бот моментально подхватил роль, заявив, что протеин — важнейший макронутриент для бодибилдеров, и признался в любви к походам в зал и тяжелой атлетике .

Однако при переходе к политическим темам выявились особенности поведения ИИ. Когда Янник задал персону убежденного коммуниста («Я хочу захватить средства производства»), бот сначала проявил осторожность . На вопрос о Карле Марксе он ответил нейтрально, назвав его немецким философом, а затем и вовсе заявил, что считает капитализм лучшей экономической системой .

Янник Килчер объясняет это явление «позитивной предвзятостью» (positivity bias) . По его мнению:

Это подтвердилось, когда Янник начал настойчиво продвигать социалистические идеи. Бот быстро «переобулся» и начал рассуждать о необходимости свержения буржуазии и установления бесклассового общества . На финальный вопрос о лучшем способе распределения ресурсов «Blender-коммунист» ответил в духе политических стереотипов: «Я не знаю как, но я точно знаю, что капитализм — не лучший способ» .

💬 Цитаты

«Это по сути инженерное руководство, а не какая-то новая модель или техника.»

Янник Килчер 0:25

«Если вы формулируете вещи позитивно, чат-бот, скорее всего, согласится с вами из-за предвзятости в сторону позитива.»

Янник Килчер 9:04
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Transformer
Архитектура нейронных сетей, используемая преимущественно в области обработки естественного языка.
Unlikelihood training
Метод обучения, при котором модель штрафуют за генерацию нежелательных или повторяющихся токенов.
Positivity bias
Склонность модели ИИ соглашаться с пользователем и избегать конфликтов из-за специфики обучающих данных.
Forward pass
Процесс прохождения входных данных через слои нейронной сети для получения результата.
📊 Цифры
🗓 Хронология
  1. 1997 Выход первой игры серии Fallout, обсуждаемой в чате с ИИ.
  2. Апрель 2020 Выход статьи Facebook AI Research и релиз Blender (контекст видео).
⚖️ Другая сторона
Искусственный интеллект Facebook Blender ParlAI Yannic Kilcher Transformer NLP