RDLY
.ru
Тренды
Статьи
Темы
Offline RL
7 статей
1ч 07м
⚖ Методы Offline RL: от имитации к оптимизации стратегий
Stanford Online · 08.12.25
1ч 20м
🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности
Stanford Online · 30.10.24
1ч 07м
🤖 Сергей Левин об эволюции обучения с подкреплением: от «бандитов» в ChatGPT до роботов-трансформеров
The TWIML AI Podcast · 16.01.23
44 мин
🧠 Авторы ChibiT о переносе знаний из текстов Wikipedia в Offline RL
Yannic Kilcher · 28.02.22
38 мин
🧠 Как предобучение трансформеров на Википедии помогает в обучении роботов
Yannic Kilcher · 26.02.22
56 мин
🤖 Как превратить обучение с подкреплением в задачу для GPT: разбор Decision Transformer
Yannic Kilcher · 05.06.21
40 мин
🤖 Пессимизм как стратегия: Аравинд Раджесваран о безопасности офлайн-обучения ИИ
The TWIML AI Podcast · 05.01.21