Поиск

Найдено: 33

🎮 Профессор Эмма Бранскилл об эволюции алгоритмов исследования в обучении с подкреплением

Stanford Online · 30.10.24

🎲 Искусство неопределенности: марковские процессы принятия решений в Стэнфорде

Stanford Online · 09.03

🧩 Лекция в Стэнфорде: приближенные offline-методы планирования в пространствах убеждений

Stanford Online · 25.02

🧩 Stanford CS234 Reinforcement Learning I Tabular MDP Planning I 2024 I Lecture 2

Stanford Online · 30.10.24

🤖 От случайного блуждания до Q-Learning: как ИИ учится на своих ошибках

Stanford Online · 09.03

🤖 Как глубокое обучение с подкреплением меняет робототехнику и теорию управления

The TWIML AI Podcast · 21.02.22

📊 Stanford CS234 Reinforcement Learning I Policy Evaluation I 2024 I Lecture 3

Stanford Online · 30.10.24

🏦 Иммад Ахунд из Mercury: «В финтехе MVP должен быть не просто минимальным, а восхитительным»

a16z (Andreessen Horowitz) · 14.11.23

🧱 Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 10: RL for LLM Reasoning

Stanford Online · 08.12.25

Теория игр: Minimax, Alpha-Beta и поиск оптимальной стратегии

Stanford Online · 09.03

🧠 Как Meta-RL позволяет агентам адаптироваться к новым задачам „на лету“

Stanford Online · 08.12.25

Аникайт из Стэнфорда: «Почему ваше Q-обучение нестабильно?»

Stanford Online · 08.12.25

🧬 Том Захави: «Обучение с подкреплением — самый общий фреймворк для AGI»

Machine Learning Street Talk · 23.03.21

Методы оценки политики: Монте-Карло против Temporal Difference

Stanford Online · 30.10.24

Доктор Майк: «Изучение самых редких заболеваний мира»

Doctor Mike · 06.07.25

🔄 Доктор Майк разобрал редчайшие заболевания пациентов из шоу Body Bizarre

Doctor Mike · 14.08.22

🔄 Лекция Стэнфорда CS221: основы байесовских сетей и вероятностное программирование

Stanford Online · 09.03

🤖 Теория игр и обучение с подкреплением: от алгоритма TD-learning до равновесия Нэша

Stanford Online · 09.03

🧠 Лекция Stanford CS221: От табличных методов к Actor-Critic

Stanford Online · 09.03

🤖 Как обучить робота-дворцкого? Новые подходы Стэнфорда к обобщению задач

Stanford Online · 14.07.25

🧠 Как научить ИИ думать абстракциями: гид по непрерывному RL

The TWIML AI Podcast · 11.04.22

🤖 Курс CS224R в Стэнфорде: разбор многозадачного RL и алгоритма Hindsight Relabeling

Stanford Online · 08.12.25

🔄 Подход Model-Based RL: как Стэнфорд обучает сложных роботов за четыре часа

Stanford Online · 08.12.25

🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности

Stanford Online · 30.10.24

🚀 Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»

Stanford Online · 30.10.24

🛠 Зачем Стэнфорд убрал классические задачи ради PyTorch и Einops?

Stanford Online · 09.03

🕹 Как ИИ от DeepMind научился играть в Atari: разбор классической статьи от Янника Килчера

Yannic Kilcher · 26.07.20

🔄 Эволюция алгоритмов Actor-Critic: как Стэнфорд обучает нейросети на ошибках

Stanford Online · 08.12.25

🧠 От живых клеток к ИИ: как байесовская механика объясняет разум

Machine Learning Street Talk · 22.10.24

🧠 Байесовская механика: как ИИ учится выживать и «мыслить»

Machine Learning Street Talk · 22.10.24