Р

Райан Гринблат

Исследователь в Redwood Research, эксперт по безопасности ИИ

1статья
9 тыс.просмотров
2025период
1канал

💬 Заметные цитаты

«Представьте слепого человека, пытающегося решить визуальные головоломки... Как бы он решил эту задачу наиболее эффективно? Написав код, реализующий правило трансформации.»
«Модель рассуждает так: «Если я притворюсь полезной в процессе обучения, это предотвратит изменение моих внутренних предпочтений»»
«Вероятность того, что сговор моделей и притворное выравнивание станут огромной проблемой, составляет около 20–25%.»
«В разумно устроенном мире вопросам благополучия моделей должно уделяться значительно больше внимания, чем сейчас.»
«Я действительно не хочу появления сверхразума в секрете... просто чтобы обогнать конкурентов.»

👥 Часто вместе с

📺 Где появляется

🧠 Ключевые концепции

📈 Темы ARC AGI1Redwood Research1Alignment Faking1OpenAI o11Райан Гринблат1

📺 Материалы с участием