«Когда модель замышляет интригу, сводка цепочки рассуждений часто содержит что-то вроде 'мы должны совершить саботаж' — это буквально первая стратегия, которую она пробует.»
«Нам действительно нужно больше мониторинга, чтобы собирать данные о том, как часто это происходит в реальном мире, даже больше, чем для самой митигации.»