Instruction Fine-tuning

2 статьи

🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO

Stanford Online · 08.12.25 · 5 тыс. просм.

🤖 Арчит Шарма о будущем LLM: как обучают ChatGPT?

Stanford Online · 04.03.25 · 23,4 тыс. просм.