RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 33
1ч 10м
🎮 Профессор Эмма Бранскилл об эволюции алгоритмов исследования в обучении с подкреплением
Stanford Online · 30.10.24
1ч 20м
🎲 Искусство неопределенности: марковские процессы принятия решений в Стэнфорде
Stanford Online · 09.03
1ч 15м
🧩 Лекция в Стэнфорде: приближенные offline-методы планирования в пространствах убеждений
Stanford Online · 25.02
1ч 13м
🧩 Stanford CS234 Reinforcement Learning I Tabular MDP Planning I 2024 I Lecture 2
Stanford Online · 30.10.24
1ч 18м
🤖 От случайного блуждания до Q-Learning: как ИИ учится на своих ошибках
Stanford Online · 09.03
1ч 22м
🤖 Как глубокое обучение с подкреплением меняет робототехнику и теорию управления
The TWIML AI Podcast · 21.02.22
1ч 20м
📊 Stanford CS234 Reinforcement Learning I Policy Evaluation I 2024 I Lecture 3
Stanford Online · 30.10.24
31 мин
🏦 Иммад Ахунд из Mercury: «В финтехе MVP должен быть не просто минимальным, а восхитительным»
a16z (Andreessen Horowitz) · 14.11.23
1ч 10м
🧱 Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 10: RL for LLM Reasoning
Stanford Online · 08.12.25
1ч 13м
Теория игр: Minimax, Alpha-Beta и поиск оптимальной стратегии
Stanford Online · 09.03
1ч 09м
🧠 Как Meta-RL позволяет агентам адаптироваться к новым задачам „на лету“
Stanford Online · 08.12.25
50 мин
Аникайт из Стэнфорда: «Почему ваше Q-обучение нестабильно?»
Stanford Online · 08.12.25
1ч 25м
🧬 Том Захави: «Обучение с подкреплением — самый общий фреймворк для AGI»
Machine Learning Street Talk · 23.03.21
1ч 20м
Методы оценки политики: Монте-Карло против Temporal Difference
Stanford Online · 30.10.24
1ч 36м
Доктор Майк: «Изучение самых редких заболеваний мира»
Doctor Mike · 06.07.25
15 мин
🔄 Доктор Майк разобрал редчайшие заболевания пациентов из шоу Body Bizarre
Doctor Mike · 14.08.22
1ч 17м
🔄 Лекция Стэнфорда CS221: основы байесовских сетей и вероятностное программирование
Stanford Online · 09.03
1ч 13м
🤖 Теория игр и обучение с подкреплением: от алгоритма TD-learning до равновесия Нэша
Stanford Online · 09.03
1ч 13м
🧠 Лекция Stanford CS221: От табличных методов к Actor-Critic
Stanford Online · 09.03
28 мин
🤖 Как обучить робота-дворцкого? Новые подходы Стэнфорда к обобщению задач
Stanford Online · 14.07.25
52 мин
🧠 Как научить ИИ думать абстракциями: гид по непрерывному RL
The TWIML AI Podcast · 11.04.22
1ч 10м
🤖 Курс CS224R в Стэнфорде: разбор многозадачного RL и алгоритма Hindsight Relabeling
Stanford Online · 08.12.25
1ч 13м
🔄 Подход Model-Based RL: как Стэнфорд обучает сложных роботов за четыре часа
Stanford Online · 08.12.25
1ч 20м
🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности
Stanford Online · 30.10.24
1ч 19м
🚀 Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»
Stanford Online · 30.10.24
1ч 06м
🛠 Зачем Стэнфорд убрал классические задачи ради PyTorch и Einops?
Stanford Online · 09.03
39 мин
🕹 Как ИИ от DeepMind научился играть в Atari: разбор классической статьи от Янника Килчера
Yannic Kilcher · 26.07.20
1ч 03м
🔄 Эволюция алгоритмов Actor-Critic: как Стэнфорд обучает нейросети на ошибках
Stanford Online · 08.12.25
2ч 45м
🧠 От живых клеток к ИИ: как байесовская механика объясняет разум
Machine Learning Street Talk · 22.10.24
2ч 45м
🧠 Байесовская механика: как ИИ учится выживать и «мыслить»
Machine Learning Street Talk · 22.10.24
1ч 28м
👽 Крис Саммерфилд: «ИИ страдает от эффекта швейцарского сыра»
Machine Learning Street Talk · 22.02.23
52 мин
🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде
Stanford Online · 08.12.25
2ч 37м
🧠 Феномен AlphaGo: как сжать бесконечный поиск в нейросеть
Dwarkesh Patel · 15.05