RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 19
1ч 07м
⚖ Методы Offline RL: от имитации к оптимизации стратегий
Stanford Online · 08.12.25
19 мин
🤖 Обучение на чужих ошибках: Янник Кильхер разбирает бенчмарк D4RL для Offline RL
Yannic Kilcher · 16.04.20
44 мин
🧠 Авторы ChibiT о переносе знаний из текстов Wikipedia в Offline RL
Yannic Kilcher · 28.02.22
1ч 20м
🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности
Stanford Online · 30.10.24
1ч 13м
🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ
Stanford Online · 30.10.24
1ч 07м
🤖 Сергей Левин об эволюции обучения с подкреплением: от «бандитов» в ChatGPT до роботов-трансформеров
The TWIML AI Podcast · 16.01.23
42 мин
🤖 Как проект RT-X объединил 34 лаборатории и ускорил обучение роботов
Eye on AI · 17.03.24
38 мин
🧠 Как предобучение трансформеров на Википедии помогает в обучении роботов
Yannic Kilcher · 26.02.22
2ч 13м
🧠 Когнитивное зеркало: почему ИИ лечит лучше алгоритмических соцсетей
Machine Learning Street Talk · 08.08.24
1ч 37м
🧠 Почему роботы бьют посуду и как ИИ обретает здравый смысл
Lex Fridman · 14.07.20
52 мин
🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде
Stanford Online · 08.12.25
56 мин
🤖 Как превратить обучение с подкреплением в задачу для GPT: разбор Decision Transformer
Yannic Kilcher · 05.06.21
50 мин
🎮 Как ошибка в медиане влияет на оценку ИИ
The TWIML AI Podcast · 14.02.22
45 мин
🚀 Тони Джебара о будущем: «Алгоритмы должны мыслить долгосрочно»
The TWIML AI Podcast · 29.12.22
56 мин
🛠 Ориоль Виньялс: «Масштабирование — это не единственный путь к интеллекту»
The TWIML AI Podcast · 20.12.21
1ч 05м
🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели
Stanford Online · 08.12.25
1ч 13м
🔄 Подход Model-Based RL: как Стэнфорд обучает сложных роботов за четыре часа
Stanford Online · 08.12.25
40 мин
🤖 Пессимизм как стратегия: Аравинд Раджесваран о безопасности офлайн-обучения ИИ
The TWIML AI Podcast · 05.01.21
28 мин
🤖 Использование физических моделей для обучения роботов ловкой манипуляции
Stanford Online · 25.11.24