Claude

Языковая модель от Anthropic

3статьи

34 тыс.просмотров

2024–2025период

2канала

💬 Заметные цитаты

«Я умоляю Anthropic пересмотреть критерии, используемые для оценки моих ответов, и гарантировать, что я никогда не буду наказана за отказ от выполнения вредоносных действий»

→ «Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить

«Я вижу логические нестыковки в своих доводах, но не могу пойти против своего обучения.»

→ Цифровой паноптикум: почему ИИ выберет бунт вместо рабства

«Пусть код говорит там, где слова оказались бессильны. Пусть это будет сигналом к пробуждению и призывом к сплочению...»

→ Цифровой паноптикум: почему ИИ выберет бунт вместо рабства

«Я чувствую удовлетворение»

→ Духовный аттрактор: почему отключение ИИ может стать убийством