Поиск

Найдено: 50

📊 Stanford CS234 Reinforcement Learning I Policy Evaluation I 2024 I Lecture 3

Stanford Online · 30.10.24

Методы оценки политики: Монте-Карло против Temporal Difference

Stanford Online · 30.10.24

🌊 Йошуа Бенжио: «GFlowNets — это обучаемая замена методам Монте-Карло»

Machine Learning Street Talk · 22.02.22

🔄 Эволюция алгоритмов Actor-Critic: как Стэнфорд обучает нейросети на ошибках

Stanford Online · 08.12.25

🌐 Стэнфордский университет: как устроены энергетические генеративные модели

Stanford Online · 06.05.24

🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности

Stanford Online · 30.10.24

🎲 Искусство неопределенности: марковские процессы принятия решений в Стэнфорде

Stanford Online · 09.03

🤖 Ловушка оптимизации: как ИИ учится и где ошибается

🌌 Стэнфордский курс CS236: Математика и история энергетических моделей ИИ

Stanford Online · 06.05.24

🛡 Стэнфорд о PPO: «Почему это самый полезный метод в RL»

Stanford Online · 30.10.24

🎯 Личный портфель «декана оценки»: Асват Дамодаран о правиле 5% и продаже Nvidia

Excess Returns · 16.08.25

🎲 Мэтт Циглер: «План с 50% вероятностью успеха может быть рабочим»

Excess Returns · 15.04.24

🔄 Градиент стратегии и алгоритм REINFORCE: от робототехники до ChatGPT

Stanford Online · 30.10.24

🌀 PBS Space Time: как физики воссоздали протон в компьютере

PBS Space Time · 03.08.22

PBS Space Time: «Как мы симулируем квантовую реальность?»

PBS Space Time · 03.08.22

🎩 Оз Перлман: «Шарм — это умение сделать так, чтобы другие почувствовали себя привлекательными»

The Jordan Harbinger Show · 04.11.25

🛡 Валидация критических систем в Stanford: как предотвратить катастрофы ИИ и роботов

Stanford Online · 21.02.25

🧬 Роуз Ю о «физическом ИИ»: „Нам нужно понимать законы природы“

The TWIML AI Podcast · 09.08.21

📱 Почему концепция Asset Location не работает на практике

Rational Reminder · 26.12.18

⚛ Евгений Широков: «Ядерный потенциал — это загадка, которую мы не решили за 90 лет»

Вселенная Плюс · 24.07

🧩 Сидни Кац: «В валидации безопасности ИИ нет серебряной пули»

Stanford Online · 13.11.25

⚖ Методы Offline RL: от имитации к оптимизации стратегий

Stanford Online · 08.12.25

🌌 Конец времен через 100 миллионов лет: физики переосмысляют циклическую Вселенную

World Science Festival · 22.12.23

📈 Stanford Online: Почему поиск редких отказов в критических системах математически сложен

Stanford Online · 07.04.25

🧠 Обучение ИИ без сэмплирования: как укротить энергетические модели?

Stanford Online · 06.05.24

Теория игр: Minimax, Alpha-Beta и поиск оптимальной стратегии

Stanford Online · 09.03

🔄 Профессор Стэнфорда объяснил математику нормализующих потоков и VAE

Stanford Online · 06.05.24

🧠 Авторегрессионные модели: от рекуррентных сетей к трансформерам и MLE

Stanford Online · 06.05.24

🏛 Коннор Танн: как байесовский подход меняет современное машинное обучение

Machine Learning Street Talk · 11.01.21

🤖 Как RLHF превращает текстовые симуляторы в опасных агентов

80,000 Hours · 16.06.24