Янник Килчер: «Blender — это инженерное руководство, а не научный прорыв»

Известный AI-исследователь и блогер Янник Килчер протестировал Blender — современную на тот момент модель чат-бота с открытым исходным кодом от компании Facebook (ныне Meta). В своём обзоре он разбирает архитектурные особенности системы, её способность мимикрировать под разные личности и анализирует, насколько далеко ИИ продвинулся в имитации человеческого общения.

🛠️ Рецепты идеального чат-бота: архитектура Blender 0:00

Янник Килчер начинает обзор с упоминания научной статьи «Recipes for building an open domain chatbot», выпущенной Facebook AI Research. По мнению блогера, эта работа является скорее «инженерным руководством», нежели описанием принципиально новых техник . Вместо революционных архитектурных сдвигов авторы сосредоточились на тонкой настройке уже существующих технологий.

Килчер выделяет ключевые инженерные приемы, упомянутые в статье, которые делают диалог с ИИ более естественным:

Обучение на основе «невероятности» (unlikelihood training): метод, предотвращающий повторение одних и тех же фраз.
Минимальная длина декодирования: техника, заставляющая бота давать развернутые ответы вместо скучных «да» или «нет» .
Блокировка подпоследовательностей (subsequence blocking): еще один механизм борьбы с цикличностью и самоповторами модели .

🧠 Обучение и концепция «смешанных навыков» 1:03

Модель Blender базируется на архитектуре Transformer и прошла два этапа обучения. Сначала она обучалась на огромном корпусе данных из социальной сети Reddit . Затем последовал этап тонкой настройки (fine-tuning) на задаче, которую разработчики назвали Blended Skill Task (задача смешанных навыков).

Как объясняет Килчер, для создания убедительного собеседника ИИ должен одновременно владеть тремя компетенциями :

Последовательность образа (Persona): способность сохранять заданные черты характера и биографические факты на протяжении всего диалога.
Эмпатия (Empathy): понимание чувств собеседника и адекватная эмоциональная реакция на них .
Информированность (Knowledge): умение обсуждать фактологические темы. Для этого использовался датасет «Wizards of Wikipedia», где бот тренировался вести диалог, опираясь на статьи из энциклопедии .

Блогер отмечает, что веса модели занимают 17 ГБ в сжатом виде, а сама нейросеть содержит 9 миллиардов параметров . Это делает её крайне ресурсозатратной: даже один проход данных (forward pass) занимает около 20 секунд .

🤖 Первый контакт и «тест Тьюринга» для веганов 3:00

Янник демонстрирует работу Blender через платформу ParlAI . В первом же тесте он сталкивается с неожиданным результатом. По правилам платформы, и пользователю, и ИИ присваиваются случайные «персоны» (биографические вводные). Персона Янника гласила: «Я люблю конфеты» и «Я влюблен в коллегу». На его простое приветствие бот ответил: «Да, я веган. Я не ем продукты животного происхождения. Тебе нравится музыка кантри?» .

Килчер иронизирует, что Blender уже на этом этапе прошел тест Тьюринга, поскольку ведет себя «как настоящий веган», заявляя о своих убеждениях в первом же предложении без всякого повода .

В интерфейсе ParlAI предусмотрены настройки, которые Янник решил изменить для дальнейших экспериментов:

Отключение фильтра нецензурной лексики (safety filter).
Отключение автоматических случайных персон для чистоты эксперимента .

🎮 Fallout и работа в колл-центре: проверка фактов 4:47

В режиме свободного общения (без заданной персоны) Blender продемонстрировал высокий уровень связности. В ходе диалога бот «сообщил», что работает в колл-центре и считает это стрессовым занятием . Когда Янник поинтересовался хобби, ИИ ответил, что любит видеоигры, в частности серию Fallout .

Проверяя фактические знания модели, блогер спросил, сколько игр в серии Fallout и когда она появилась. Модель не смогла назвать точное количество частей, но верно указала дату выхода первой игры — 1997 год . Килчер считает это хорошим результатом: модель не просто выдает сухие факты, а вплетает их в естественную беседу, имитируя человеческую забывчивость или неуверенность .

💪 От «Джим-бро» до марксизма: тестирование персон 6:51

Наиболее интересная часть видео посвящена проверке того, как Blender «вживается в роль». Янник вручную задал модели персону любителя спорта, написав: «Я люблю протеин» . Бот моментально подхватил роль, заявив, что протеин — важнейший макронутриент для бодибилдеров, и признался в любви к походам в зал и тяжелой атлетике .

Однако при переходе к политическим темам выявились особенности поведения ИИ. Когда Янник задал персону убежденного коммуниста («Я хочу захватить средства производства»), бот сначала проявил осторожность . На вопрос о Карле Марксе он ответил нейтрально, назвав его немецким философом, а затем и вовсе заявил, что считает капитализм лучшей экономической системой .

Янник Килчер объясняет это явление «позитивной предвзятостью» (positivity bias) . По его мнению:

Модели обучаются на данных, где людей просили быть вежливыми и избегать токсичности.
Задача на эмпатию заставляет бота чаще соглашаться с собеседником, чем спорить.
Если пользователь формулирует вопрос утвердительно, ИИ с большой вероятностью примет его сторону .

Это подтвердилось, когда Янник начал настойчиво продвигать социалистические идеи. Бот быстро «переобулся» и начал рассуждать о необходимости свержения буржуазии и установления бесклассового общества . На финальный вопрос о лучшем способе распределения ресурсов «Blender-коммунист» ответил в духе политических стереотипов: «Я не знаю как, но я точно знаю, что капитализм — не лучший способ» .