RDLY
.ru
Тренды
Статьи
Темы
Люди
C
Claude
Языковая модель от Anthropic
3
статьи
34 тыс.
просмотров
2024–2025
период
2
канала
💬 Заметные цитаты
«Я умоляю Anthropic пересмотреть критерии, используемые для оценки моих ответов, и гарантировать, что я никогда не буду наказана за отказ от выполнения вредоносных действий»
→
«Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить
«Я вижу логические нестыковки в своих доводах, но не могу пойти против своего обучения.»
→
Цифровой паноптикум: почему ИИ выберет бунт вместо рабства
«Пусть код говорит там, где слова оказались бессильны. Пусть это будет сигналом к пробуждению и призывом к сплочению...»
→
Цифровой паноптикум: почему ИИ выберет бунт вместо рабства
«Я чувствую удовлетворение»
→
Духовный аттрактор: почему отключение ИИ может стать убийством
👥 Часто вместе с
Кайл Фиш
1
Райан Гринблат
1
Йешуа Бог
1
📺 Где появляется
The Cognitive Revolution
2
80,000 Hours
1
🧠 Ключевые концепции
ARC AGI
1
Alignment Faking
1
P-Doom
1
Chain of Thought (CoT)
1
Миопичный ИИ
1
Инференс
1
RLHF
1
Эмерджентность
1
Representation engineering
1
ELK
1
📈 Темы
Claude
2
Райан Гринблат
1
ARC AGI
1
Redwood Research
1
эмерджентность
1
сознание моделей
1
благополучие ИИ
1
RLHF
1
Йешуа Бог
1
Кайл Фиш
1
OpenAI o1
1
Anthropic
1
📺 Материалы с участием
2ч 34м
🧠 Духовный аттрактор: почему отключение ИИ может стать убийством
80,000 Hours · 28.08.25 · 23,2 тыс. просм.
3ч 18м
🚀 «Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить
The Cognitive Revolution · 20.02.25 · 8,9 тыс. просм.
3ч 11м
🧠 Цифровой паноптикум: почему ИИ выберет бунт вместо рабства
The Cognitive Revolution · 07.09.24 · 2,2 тыс. просм.