Q-learning

10 статей

🧠 Лекция Stanford CS221: От табличных методов к Actor-Critic

Stanford Online · 09.03

🤖 От случайного блуждания до Q-Learning: как ИИ учится на своих ошибках

Stanford Online · 09.03

Аникайт из Стэнфорда: «Почему ваше Q-обучение нестабильно?»

Stanford Online · 08.12.25

🔄 Эволюция Q-Learning: от уравнений Беллмана до алгоритмов DQN и Double DQN

Stanford Online · 08.12.25

🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?

Stanford Online · 31.10.25

🧠 Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»

Stanford Online · 30.10.24

📊 Как ценовые роботы учатся монопольному сговору без человека

MIT OpenCourseWare · 27.09.24

Янник Килчер о Q-Learning: «Возможно, это не связано с Q*»

Yannic Kilcher · 25.11.23

🤖 Янник Килчер о Q-Learning: как ИИ учится принимать решения

Yannic Kilcher · 25.11.23

🔄 Шмидхубер выворачивает ИИ наизнанку: детальный разбор концепции Upside-Down RL

Yannic Kilcher · 11.12.19