Как человеческая интуиция мешает и помогает нам в видеоиграх

Yannic Kilcher 2,6 тыс. 10 мин 3 мин 20.05.2020
Главное

Исследователи из Калифорнийского университета в Беркли и других ведущих институтов задались вопросом: почему люди осваивают видеоигры за считаные минуты, в то время как алгоритмам глубокого обучения (RL) требуются миллионы попыток? Ответ кроется в «байесовских априорных знаниях» (priors) — багаже опыта о физике мира и значении объектов, который мы приносим с собой в виртуальное пространство.

Янник Килчер, автор популярного канала об ИИ, разбирает работу «Investigating Human Priors for Playing Video Games» и наглядно демонстрирует, во что превращается геймплей, если лишить человека его интуитивных ожиданий.

🕹️ Что такое априорные знания в гейминге? 0:00

Большинство видеоигр создано людьми для людей, а значит, они опираются на наш повседневный опыт. Мы знаем, что огонь обжигает, лестницы нужны для подъема, а пропасть — это смерть. Эти знания позволяют нам играть эффективно с первой секунды. В своей работе авторы (Ратчет Дуби, Пулкит Агравал, Дипак Патек, Том Гриффитс и Алексей Эфрос) решили провести «абляцию» — систематическое удаление этих факторов, чтобы измерить их вклад в успех игрока .

Для экспериментов была разработана игра в стиле классической Montezuma's Revenge. В оригинале всё просто: нужно перепрыгивать через враждебных существ и шипы, карабкаться по лестницам, забрать ключ и открыть дверь . Однако, когда исследователи начинают менять правила восприятия, человеческий интеллект сталкивается с серьезными препятствиями.

🧩 Уровни деградации: от замены текстур до нарушения физики 1:03

Янник Килчер демонстрирует несколько режимов игры, каждый из которых отключает определенный тип «человеческих настроек»:

Килчер отмечает, что самым тяжелым испытанием становится изменение логики взаимодействия с объектами. Например, лестницы могут перестать работать привычным образом, требуя от игрока двигаться влево-вправо вместо нажатия «вверх» . Это нарушает глубоко укоренившиеся моторные навыки.

🧠 Гвинея-пиг для ИИ: почему алгоритмы побеждают в хаосе? 7:27

Главный вывод исследования, как подчеркивает Килчер, заключается в сравнении человека и алгоритмов обучения с подкреплением (Reinforcement Learning). То, что для человека является «адом» и «худшей игрой в мире» , для RL-агента — стандартная рабочая среда.

📊 Результаты и перспективы ИИ 8:44

Данные исследования показывают, что «маскировка идентификации объектов» наносит самый сильный удар по человеческой продуктивности, увеличивая время прохождения и количество смертей в десятки раз .

Янник Килчер заключает, что перед разработчиками ИИ стоят два пути:

  1. Вшивать человеческие априорные знания в алгоритмы, чтобы они учились так же быстро, как мы .
  2. Обучать алгоритмы этим знаниям заранее на огромных массивах данных, прежде чем выпускать их в конкретную среду .

Исследование доказывает, что наша невероятная скорость обучения — это не только заслуга «чистого интеллекта», но и результат эффективного использования багажа знаний о реальном мире, который мы подсознательно переносим в любую новую задачу.

💬 Цитаты

«Это была бы самая плохо продаваемая видеоигра всех времен, где динамически удаляются все ваши априорные ожидания.»

Янник Килчер 09:24

«Либо мы встраиваем эти знания в алгоритмы обучения с подкреплением, либо смиряемся с тем, что им приходится выяснять всё с нуля.»

Янник Килчер 08:18
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Priors (Априорные знания)
Предварительные знания или убеждения, которые субъект приносит с собой до начала эксперимента или игры.
Ablation (Абляция)
Метод исследования, при котором поочередно удаляются компоненты системы, чтобы понять их вклад в общую работу.
Reinforcement Learning (RL)
Метод обучения ИИ, при котором агент получает награды или наказания за свои действия в среде.
Affordances (Возможности)
Свойства объекта, которые подсказывают человеку, как с ним можно взаимодействовать (например, ручка подсказывает, что за нее надо тянуть).
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Reinforcement Learning Yannic Kilcher Human Priors Deepak Pathak Montezuma's Revenge