RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 19
1ч 18м
🧠 Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»
Stanford Online · 30.10.24
1ч 20м
🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности
Stanford Online · 30.10.24
44 мин
🎨 Даг Эк: как проект Magenta обучает нейросети искусству и музыке
Y Combinator · 21.07.17
45 мин
🤖 Янник Килчер о Q-Learning: как ИИ учится принимать решения
Yannic Kilcher · 25.11.23
1ч 12м
✂ Как алгоритм ReBeL научился обыгрывать людей в покер с помощью теории игр
Yannic Kilcher · 16.12.20
1ч 38м
🤖 Дарио Амодеи об OpenAI, рисках AGI и о том, как попасть в индустрию безопасности ИИ
80,000 Hours · 24.08.18
1ч 17м
🧠 Стэнфордский профессор объяснил, как сэмплирование Томпсона спасает рекомендательные системы от задержек данных
Stanford Online · 30.10.24
1ч 13м
🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ
Stanford Online · 30.10.24
1ч 01м
🔄 Эволюция Q-Learning: от уравнений Беллмана до алгоритмов DQN и Double DQN
Stanford Online · 08.12.25
50 мин
Аникайт из Стэнфорда: «Почему ваше Q-обучение нестабильно?»
Stanford Online · 08.12.25
46 мин
🚀 Уэс Рот: «Gemini 2.5 Pro — это абсолютный зверь в кодинге»
Wes Roth · 28.03.25
39 мин
🕹 Как ИИ от DeepMind научился играть в Atari: разбор классической статьи от Янника Килчера
Yannic Kilcher · 26.07.20
1ч 08м
🔄 Градиент стратегии и алгоритм REINFORCE: от робототехники до ChatGPT
Stanford Online · 30.10.24
52 мин
🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде
Stanford Online · 08.12.25
1ч 05м
🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели
Stanford Online · 08.12.25
1ч 07м
⚖ Методы Offline RL: от имитации к оптимизации стратегий
Stanford Online · 08.12.25
55 мин
🧠 Как решать новые задачи в RL без переобучения: разбор Янника Килчера
Yannic Kilcher · 23.08.20
1ч 10м
🎯 Профессор Стэнфорда разобрал ключевые вызовы и методологию исследований Deep RL
Stanford Online · 08.12.25
1ч 55м
🔬 Как Future House автоматизирует научные открытия с помощью ИИ-агентов
The Cognitive Revolution · 05.12.24