Q-learning

10 статей

🧠 Лекция Stanford CS221: От табличных методов к Actor-Critic

Stanford Online · 09.03 · 561 просм.

🤖 От случайного блуждания до Q-Learning: как ИИ учится на своих ошибках

Stanford Online · 09.03 · 811 просм.

Аникайт из Стэнфорда: «Почему ваше Q-обучение нестабильно?»

Stanford Online · 08.12.25 · 3,9 тыс. просм.

🔄 Эволюция Q-Learning: от уравнений Беллмана до алгоритмов DQN и Double DQN

Stanford Online · 08.12.25 · 5,7 тыс. просм.

🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?

Stanford Online · 31.10.25 · 36 тыс. просм.

🧠 Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»

Stanford Online · 30.10.24 · 19 тыс. просм.

📊 Как ценовые роботы учатся монопольному сговору без человека

MIT OpenCourseWare · 27.09.24 · 2,4 тыс. просм.

Янник Килчер о Q-Learning: «Возможно, это не связано с Q*»

Yannic Kilcher · 25.11.23 · 115 тыс. просм.

🤖 Янник Килчер о Q-Learning: как ИИ учится принимать решения

Yannic Kilcher · 25.11.23 · 115 тыс. просм.

🔄 Шмидхубер выворачивает ИИ наизнанку: детальный разбор концепции Upside-Down RL

Yannic Kilcher · 11.12.19 · 10,6 тыс. просм.