RDLY
.ru
Тренды
Статьи
Темы
TD-learning
2 статьи
1ч 13м
🤖 Теория игр и обучение с подкреплением: от алгоритма TD-learning до равновесия Нэша
Stanford Online · 09.03
50 мин
Аникайт из Стэнфорда: «Почему ваше Q-обучение нестабильно?»
Stanford Online · 08.12.25