RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 3
1ч 07м
🎲 Как математический метод дерева разоблачает ошибки человеческой интуиции
MIT OpenCourseWare · 22.07.25
1ч 02м
🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO
Stanford Online · 08.12.25
1ч 18м
🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград
Stanford Online · 30.10.24