RDLY
.ru
Тренды
Статьи
Темы
Пост-обучение
2 статьи
1ч 42м
🌪 Эпоха фабрик данных: как CEO Labelbox строит конвейер для обучения AGI с экспертами на $250k в год
The Cognitive Revolution · 08.07.25
1ч 19м
📈 Пост-обучение больших языковых моделей: от контекстного промптинга до алгоритмов RLHF и DPO
Stanford Online · 04.03.25