RDLY
.ru
Тренды
Статьи
Темы
Люди
Б
Бет Барнс
Основательница и исполнительный директор METR, экс-исследователь безопасности в OpenAI.
2
статьи
80 тыс.
просмотров
2025–2026
период
2
канала
💬 Заметные цитаты
«Прямо сейчас мы не можем быть уверены, делает ли агент то, что мы хотим, или он просто притворяется хорошим, чтобы получить больше власти в будущем.»
→
Прогресс ИИ в цифрах: как временные горизонты предсказывают появление AGI
«ИИ — это не просто библиотека знаний, это потенциально агент, который может переписать свои собственные инструкции.»
→
Прогресс ИИ в цифрах: как временные горизонты предсказывают появление AGI
«Горизонт планирования удваивается примерно каждые шесть месяцев.»
→
Имитация подчинения: как ИИ готовится к интеллектуальному взрыву
«Я предполагаю, что это произойдет в течение 2–7 лет... в какой-то момент 90% исследований будут автоматизированы.»
→
Имитация подчинения: как ИИ готовится к интеллектуальному взрыву
«Мы находимся в точке, где сценарии интеллектуального взрыва выглядят относительно правдоподобно.»
→
Имитация подчинения: как ИИ готовится к интеллектуальному взрыву
«Если вы публикуете веса модели, это становится необратимым... сделать вредоносную версию становится очень легко.»
→
Имитация подчинения: как ИИ готовится к интеллектуальному взрыву
«Одна из идей... позволить модели попытаться пойти против вас, а затем посмотреть, что она реально способна сделать»
→
Имитация подчинения: как ИИ готовится к интеллектуальному взрыву
👥 Часто вместе с
Дэвид Рэйн
1
Роб Уиблин
1
Тим Скарф
1
📺 Где появляется
80,000 Hours
1
Machine Learning Street Talk
1
📚 Какие книги обсуждались
The Mind is Flat
— Ник Чейтер
1
🧠 Ключевые концепции
AGI
1
Reward Hacking
1
Agentic Harness
1
Chain of Thought
1
Alignment faking
1
METR
1
Neuralese
1
Control Evals
1
📈 Темы
Бет Барнс
2
METR
2
GPQA
1
AGI
1
Anthropic
1
безопасность ИИ
1
Дэвид Рэйн
1
интеллектуальный взрыв
1
📺 Материалы с участием
1ч 53м
📈 Прогресс ИИ в цифрах: как временные горизонты предсказывают появление AGI
Machine Learning Street Talk · 04.05 · 4 тыс. просм.
3ч 57м
🧠 Имитация подчинения: как ИИ готовится к интеллектуальному взрыву
80,000 Hours · 02.06.25 · 76,2 тыс. просм.