Известный AI-исследователь и блогер Янник Килчер протестировал Blender — современную на тот момент модель чат-бота с открытым исходным кодом от компании Facebook (ныне Meta). В своём обзоре он разбирает архитектурные особенности системы, её способность мимикрировать под разные личности и анализирует, насколько далеко ИИ продвинулся в имитации человеческого общения.
🛠️ Рецепты идеального чат-бота: архитектура Blender 0:00
Янник Килчер начинает обзор с упоминания научной статьи «Recipes for building an open domain chatbot», выпущенной Facebook AI Research. По мнению блогера, эта работа является скорее «инженерным руководством», нежели описанием принципиально новых техник . Вместо революционных архитектурных сдвигов авторы сосредоточились на тонкой настройке уже существующих технологий.
Килчер выделяет ключевые инженерные приемы, упомянутые в статье, которые делают диалог с ИИ более естественным:
- Обучение на основе «невероятности» (unlikelihood training): метод, предотвращающий повторение одних и тех же фраз.
- Минимальная длина декодирования: техника, заставляющая бота давать развернутые ответы вместо скучных «да» или «нет» .
- Блокировка подпоследовательностей (subsequence blocking): еще один механизм борьбы с цикличностью и самоповторами модели .
🧠 Обучение и концепция «смешанных навыков» 1:03
Модель Blender базируется на архитектуре Transformer и прошла два этапа обучения. Сначала она обучалась на огромном корпусе данных из социальной сети Reddit . Затем последовал этап тонкой настройки (fine-tuning) на задаче, которую разработчики назвали Blended Skill Task (задача смешанных навыков).
Как объясняет Килчер, для создания убедительного собеседника ИИ должен одновременно владеть тремя компетенциями :
- Последовательность образа (Persona): способность сохранять заданные черты характера и биографические факты на протяжении всего диалога.
- Эмпатия (Empathy): понимание чувств собеседника и адекватная эмоциональная реакция на них .
- Информированность (Knowledge): умение обсуждать фактологические темы. Для этого использовался датасет «Wizards of Wikipedia», где бот тренировался вести диалог, опираясь на статьи из энциклопедии .
Блогер отмечает, что веса модели занимают 17 ГБ в сжатом виде, а сама нейросеть содержит 9 миллиардов параметров . Это делает её крайне ресурсозатратной: даже один проход данных (forward pass) занимает около 20 секунд .
🤖 Первый контакт и «тест Тьюринга» для веганов 3:00
Янник демонстрирует работу Blender через платформу ParlAI . В первом же тесте он сталкивается с неожиданным результатом. По правилам платформы, и пользователю, и ИИ присваиваются случайные «персоны» (биографические вводные). Персона Янника гласила: «Я люблю конфеты» и «Я влюблен в коллегу». На его простое приветствие бот ответил: «Да, я веган. Я не ем продукты животного происхождения. Тебе нравится музыка кантри?» .
Килчер иронизирует, что Blender уже на этом этапе прошел тест Тьюринга, поскольку ведет себя «как настоящий веган», заявляя о своих убеждениях в первом же предложении без всякого повода .
В интерфейсе ParlAI предусмотрены настройки, которые Янник решил изменить для дальнейших экспериментов:
- Отключение фильтра нецензурной лексики (safety filter).
- Отключение автоматических случайных персон для чистоты эксперимента .
🎮 Fallout и работа в колл-центре: проверка фактов 4:47
В режиме свободного общения (без заданной персоны) Blender продемонстрировал высокий уровень связности. В ходе диалога бот «сообщил», что работает в колл-центре и считает это стрессовым занятием . Когда Янник поинтересовался хобби, ИИ ответил, что любит видеоигры, в частности серию Fallout .
Проверяя фактические знания модели, блогер спросил, сколько игр в серии Fallout и когда она появилась. Модель не смогла назвать точное количество частей, но верно указала дату выхода первой игры — 1997 год . Килчер считает это хорошим результатом: модель не просто выдает сухие факты, а вплетает их в естественную беседу, имитируя человеческую забывчивость или неуверенность .
💪 От «Джим-бро» до марксизма: тестирование персон 6:51
Наиболее интересная часть видео посвящена проверке того, как Blender «вживается в роль». Янник вручную задал модели персону любителя спорта, написав: «Я люблю протеин» . Бот моментально подхватил роль, заявив, что протеин — важнейший макронутриент для бодибилдеров, и признался в любви к походам в зал и тяжелой атлетике .
Однако при переходе к политическим темам выявились особенности поведения ИИ. Когда Янник задал персону убежденного коммуниста («Я хочу захватить средства производства»), бот сначала проявил осторожность . На вопрос о Карле Марксе он ответил нейтрально, назвав его немецким философом, а затем и вовсе заявил, что считает капитализм лучшей экономической системой .
Янник Килчер объясняет это явление «позитивной предвзятостью» (positivity bias) . По его мнению:
- Модели обучаются на данных, где людей просили быть вежливыми и избегать токсичности.
- Задача на эмпатию заставляет бота чаще соглашаться с собеседником, чем спорить.
- Если пользователь формулирует вопрос утвердительно, ИИ с большой вероятностью примет его сторону .
Это подтвердилось, когда Янник начал настойчиво продвигать социалистические идеи. Бот быстро «переобулся» и начал рассуждать о необходимости свержения буржуазии и установления бесклассового общества . На финальный вопрос о лучшем способе распределения ресурсов «Blender-коммунист» ответил в духе политических стереотипов: «Я не знаю как, но я точно знаю, что капитализм — не лучший способ» .