RDLY
.ru
Тренды
Статьи
Темы
MMLU
3 статьи
1ч 49м
🎯 Афшин и Шервин об эволюции оценки LLM: от человеческой разметки до агентов-симуляторов
Stanford Online · 02.12.25
1ч 20м
📉 Кризис оценки ИИ: почему современные бенчмарки лгут?
Stanford Online · 04.06.25
2ч 37м
🧬 Последний экзамен человечества: Дэн Хендрикс о безопасности сверхразума
The Cognitive Revolution · 19.10.24