Q-learning

10 статей

1ч 13м
🧠 Лекция Stanford CS221: От табличных методов к Actor-Critic
Stanford Online · 09.03 · 561 просм.
1ч 18м
🤖 От случайного блуждания до Q-Learning: как ИИ учится на своих ошибках
Stanford Online · 09.03 · 811 просм.
50 мин
Аникайт из Стэнфорда: «Почему ваше Q-обучение нестабильно?»
Stanford Online · 08.12.25 · 3,9 тыс. просм.
1ч 01м
🔄 Эволюция Q-Learning: от уравнений Беллмана до алгоритмов DQN и Double DQN
Stanford Online · 08.12.25 · 5,7 тыс. просм.
1ч 44м
🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?
Stanford Online · 31.10.25 · 36 тыс. просм.
1ч 18м
🧠 Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»
Stanford Online · 30.10.24 · 19 тыс. просм.
1ч 20м
📊 Как ценовые роботы учатся монопольному сговору без человека
MIT OpenCourseWare · 27.09.24 · 2,4 тыс. просм.
45 мин
Янник Килчер о Q-Learning: «Возможно, это не связано с Q*»
Yannic Kilcher · 25.11.23 · 115 тыс. просм.
45 мин
🤖 Янник Килчер о Q-Learning: как ИИ учится принимать решения
Yannic Kilcher · 25.11.23 · 115 тыс. просм.
26 мин
🔄 Шмидхубер выворачивает ИИ наизнанку: детальный разбор концепции Upside-Down RL
Yannic Kilcher · 11.12.19 · 10,6 тыс. просм.