RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 5
1ч 20м
Методы оценки политики: Монте-Карло против Temporal Difference
Stanford Online · 30.10.24
1ч 08м
🔄 Градиент стратегии и алгоритм REINFORCE: от робототехники до ChatGPT
Stanford Online · 30.10.24
52 мин
🤖 Исследователи из Университета Пердью обучили робота за рекордные сроки с помощью физических априоров дифференциальных уравнений
Stanford Online · 16.01
1ч 58м
🪱 Макс Беннетт: «История интеллекта за 600 миллионов лет: от червя до нейросетей»
The Cognitive Revolution · 07.02.24
50 мин
Аникайт из Стэнфорда: «Почему ваше Q-обучение нестабильно?»
Stanford Online · 08.12.25