RDLY
.ru
Тренды
Статьи
Темы
выравнивание ИИ
4 статьи
3ч 06м
🤖 Искусство обмана: почему ИИ начнет скрывать свои цели
80,000 Hours · 03.12.25
2ч 10м
🕵 Стратегический обман: как ИИ учится манипулировать разработчиками
The Cognitive Revolution · 18.09.25
3ч 09м
🤖 Как RLHF превращает текстовые симуляторы в опасных агентов
80,000 Hours · 16.06.24
45 мин
🧠 Как стать исследователем выравнивания ИИ: подробный гид Яна Лейке
80,000 Hours · 16.09.18