Поиск

Найдено: 50

1ч 20м
📊 Stanford CS234 Reinforcement Learning I Policy Evaluation I 2024 I Lecture 3
Stanford Online · 30.10.24
1ч 20м
Методы оценки политики: Монте-Карло против Temporal Difference
Stanford Online · 30.10.24
1ч 33м
🌊 Йошуа Бенжио: «GFlowNets — это обучаемая замена методам Монте-Карло»
Machine Learning Street Talk · 22.02.22
1ч 03м
🔄 Эволюция алгоритмов Actor-Critic: как Стэнфорд обучает нейросети на ошибках
Stanford Online · 08.12.25
1ч 24м
🌐 Стэнфордский университет: как устроены энергетические генеративные модели
Stanford Online · 06.05.24
1ч 20м
🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности
Stanford Online · 30.10.24
1ч 20м
🎲 Искусство неопределенности: марковские процессы принятия решений в Стэнфорде
Stanford Online · 09.03
1ч 24м
🌌 Стэнфордский курс CS236: Математика и история энергетических моделей ИИ
Stanford Online · 06.05.24
1ч 19м
🛡 Стэнфорд о PPO: «Почему это самый полезный метод в RL»
Stanford Online · 30.10.24
🎯 Личный портфель «декана оценки»: Асват Дамодаран о правиле 5% и продаже Nvidia
Excess Returns · 16.08.25
58 мин
🎲 Мэтт Циглер: «План с 50% вероятностью успеха может быть рабочим»
Excess Returns · 15.04.24
1ч 08м
🔄 Градиент стратегии и алгоритм REINFORCE: от робототехники до ChatGPT
Stanford Online · 30.10.24
19 мин
🌀 PBS Space Time: как физики воссоздали протон в компьютере
PBS Space Time · 03.08.22
19 мин
PBS Space Time: «Как мы симулируем квантовую реальность?»
PBS Space Time · 03.08.22
1ч 56м
🎩 Оз Перлман: «Шарм — это умение сделать так, чтобы другие почувствовали себя привлекательными»
The Jordan Harbinger Show · 04.11.25
1ч 06м
🛡 Валидация критических систем в Stanford: как предотвратить катастрофы ИИ и роботов
Stanford Online · 21.02.25
32 мин
🧬 Роуз Ю о «физическом ИИ»: „Нам нужно понимать законы природы“
The TWIML AI Podcast · 09.08.21
32 мин
📱 Почему концепция Asset Location не работает на практике
Rational Reminder · 26.12.18
51 мин
🧩 Сидни Кац: «В валидации безопасности ИИ нет серебряной пули»
Stanford Online · 13.11.25
1ч 07м
⚖ Методы Offline RL: от имитации к оптимизации стратегий
Stanford Online · 08.12.25
1ч 24м
🌌 Конец времен через 100 миллионов лет: физики переосмысляют циклическую Вселенную
World Science Festival · 22.12.23
1ч 15м
📈 Stanford Online: Почему поиск редких отказов в критических системах математически сложен
Stanford Online · 07.04.25
1ч 23м
🧠 Обучение ИИ без сэмплирования: как укротить энергетические модели?
Stanford Online · 06.05.24
1ч 13м
Теория игр: Minimax, Alpha-Beta и поиск оптимальной стратегии
Stanford Online · 09.03
1ч 22м
🔄 Профессор Стэнфорда объяснил математику нормализующих потоков и VAE
Stanford Online · 06.05.24
1ч 23м
🧠 Авторегрессионные модели: от рекуррентных сетей к трансформерам и MLE
Stanford Online · 06.05.24
1ч 35м
🏛 Коннор Танн: как байесовский подход меняет современное машинное обучение
Machine Learning Street Talk · 11.01.21
3ч 09м
🤖 Как RLHF превращает текстовые симуляторы в опасных агентов
80,000 Hours · 16.06.24
1ч 45м
🧠 Йонас Хюботтер: «Локальное обучение ИИ превосходит огромные модели в 30 раз»
Machine Learning Street Talk · 30.11.24
1ч 03м
🔄 Stanford Online: «Методы Actor-Critic — база для обучения LLM и роботов»
Stanford Online · 08.12.25