# Янник Килчер: «Blender — это инженерное руководство, а не научный прорыв»

Источник: https://www.youtube.com/watch?v=wTIPGoHLw_8
Канал: Yannic Kilcher
Опубликовано: 03.05.2020

---

Известный AI-исследователь и блогер Янник Килчер протестировал Blender — современную на тот момент модель чат-бота с открытым исходным кодом от компании Facebook (ныне Meta). В своём обзоре он разбирает архитектурные особенности системы, её способность мимикрировать под разные личности и анализирует, насколько далеко ИИ продвинулся в имитации человеческого общения.

## 🛠️ Рецепты идеального чат-бота: архитектура Blender
[[JUMP:0:00]]

Янник Килчер начинает обзор с упоминания научной статьи «Recipes for building an open domain chatbot», выпущенной Facebook AI Research. По мнению блогера, эта работа является скорее «инженерным руководством», нежели описанием принципиально новых техник [0:25]. Вместо революционных архитектурных сдвигов авторы сосредоточились на тонкой настройке уже существующих технологий.

Килчер выделяет ключевые инженерные приемы, упомянутые в статье, которые делают диалог с ИИ более естественным:

*   **Обучение на основе «невероятности» (unlikelihood training):** метод, предотвращающий повторение одних и тех же фраз.
*   **Минимальная длина декодирования:** техника, заставляющая бота давать развернутые ответы вместо скучных «да» или «нет» [0:38].
*   **Блокировка подпоследовательностей (subsequence blocking):** еще один механизм борьбы с цикличностью и самоповторами модели [0:51].

## 🧠 Обучение и концепция «смешанных навыков»
[[JUMP:1:03]]

Модель Blender базируется на архитектуре Transformer и прошла два этапа обучения. Сначала она обучалась на огромном корпусе данных из социальной сети Reddit [1:17]. Затем последовал этап тонкой настройки (fine-tuning) на задаче, которую разработчики назвали Blended Skill Task (задача смешанных навыков).

Как объясняет Килчер, для создания убедительного собеседника ИИ должен одновременно владеть тремя компетенциями [1:29]:

1.  **Последовательность образа (Persona):** способность сохранять заданные черты характера и биографические факты на протяжении всего диалога.
2.  **Эмпатия (Empathy):** понимание чувств собеседника и адекватная эмоциональная реакция на них [1:41].
3.  **Информированность (Knowledge):** умение обсуждать фактологические темы. Для этого использовался датасет «Wizards of Wikipedia», где бот тренировался вести диалог, опираясь на статьи из энциклопедии [1:54].

Блогер отмечает, что веса модели занимают 17 ГБ в сжатом виде, а сама нейросеть содержит 9 миллиардов параметров [2:46]. Это делает её крайне ресурсозатратной: даже один проход данных (forward pass) занимает около 20 секунд [2:46].

## 🤖 Первый контакт и «тест Тьюринга» для веганов
[[JUMP:3:00]]

Янник демонстрирует работу Blender через платформу ParlAI [2:21]. В первом же тесте он сталкивается с неожиданным результатом. По правилам платформы, и пользователю, и ИИ присваиваются случайные «персоны» (биографические вводные). Персона Янника гласила: «Я люблю конфеты» и «Я влюблен в коллегу». На его простое приветствие бот ответил: «Да, я веган. Я не ем продукты животного происхождения. Тебе нравится музыка кантри?» [3:52].

Килчер иронизирует, что Blender уже на этом этапе прошел тест Тьюринга, поскольку ведет себя «как настоящий веган», заявляя о своих убеждениях в первом же предложении без всякого повода [4:04]. 

В интерфейсе ParlAI предусмотрены настройки, которые Янник решил изменить для дальнейших экспериментов:

*   Отключение фильтра нецензурной лексики (safety filter).
*   Отключение автоматических случайных персон для чистоты эксперимента [4:18].

## 🎮 Fallout и работа в колл-центре: проверка фактов
[[JUMP:4:47]]

В режиме свободного общения (без заданной персоны) Blender продемонстрировал высокий уровень связности. В ходе диалога бот «сообщил», что работает в колл-центре и считает это стрессовым занятием [5:14]. Когда Янник поинтересовался хобби, ИИ ответил, что любит видеоигры, в частности серию Fallout [5:42].

Проверяя фактические знания модели, блогер спросил, сколько игр в серии Fallout и когда она появилась. Модель не смогла назвать точное количество частей, но верно указала дату выхода первой игры — 1997 год [6:22]. Килчер считает это хорошим результатом: модель не просто выдает сухие факты, а вплетает их в естественную беседу, имитируя человеческую забывчивость или неуверенность [6:35].

## 💪 От «Джим-бро» до марксизма: тестирование персон
[[JUMP:6:51]]

Наиболее интересная часть видео посвящена проверке того, как Blender «вживается в роль». Янник вручную задал модели персону любителя спорта, написав: «Я люблю протеин» [7:02]. Бот моментально подхватил роль, заявив, что протеин — важнейший макронутриент для бодибилдеров, и признался в любви к походам в зал и тяжелой атлетике [7:15]. 

Однако при переходе к политическим темам выявились особенности поведения ИИ. Когда Янник задал персону убежденного коммуниста («Я хочу захватить средства производства»), бот сначала проявил осторожность [8:08]. На вопрос о Карле Марксе он ответил нейтрально, назвав его немецким философом, а затем и вовсе заявил, что считает капитализм лучшей экономической системой [8:37].

Янник Килчер объясняет это явление «позитивной предвзятостью» (positivity bias) [9:04]. По его мнению:

*   Модели обучаются на данных, где людей просили быть вежливыми и избегать токсичности.
*   Задача на эмпатию заставляет бота чаще соглашаться с собеседником, чем спорить.
*   Если пользователь формулирует вопрос утвердительно, ИИ с большой вероятностью примет его сторону [9:16].

Это подтвердилось, когда Янник начал настойчиво продвигать социалистические идеи. Бот быстро «переобулся» и начал рассуждать о необходимости свержения буржуазии и установления бесклассового общества [10:12]. На финальный вопрос о лучшем способе распределения ресурсов «Blender-коммунист» ответил в духе политических стереотипов: «Я не знаю как, но я точно знаю, что капитализм — не лучший способ» [10:42].