RDLY
.ru
Тренды
Статьи
Темы
Люди
Instruction Fine-tuning
2 статьи
1ч 02м
🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO
Stanford Online · 08.12.25 · 5 тыс. просм.
1ч 19м
🤖 Арчит Шарма о будущем LLM: как обучают ChatGPT?
Stanford Online · 04.03.25 · 23,4 тыс. просм.