Поиск

Найдено: 41

52 мин
🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде
Stanford Online · 08.12.25
1ч 07м
🤖 Имитационное обучение: почему простого копирования действий недостаточно
Stanford Online · 08.12.25
1ч 05м
🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели
Stanford Online · 08.12.25
1ч 36м
🛑 Эйсо Кант: «Вы не придете к AGI с помощью файн-тюнинга»
Machine Learning Street Talk · 02.04.25
1ч 16м
🧠 Кевин Эллис и Зенна Таварес о будущем AI: почему имитации недостаточно для создания мировых моделей
Machine Learning Street Talk · 08.04.25
49 мин
⚖ Лекция в Стэнфорде: развитие интеллекта роботов через RL
Stanford Online · 08.12.25
1ч 05м
🤖 Стэнфордский курс CS224R: концепции и алгоритмы автономного обучения роботов
Stanford Online · 08.12.25
1ч 02м
🤖 Градиент стратегии в Reinforcement Learning: от REINFORCE до Importance Sampling
Stanford Online · 08.12.25
31 мин
🌐 Янник Кильхер: WebGPT, ожившие рисунки и новый журнал TMLR
Yannic Kilcher · 24.12.21
49 мин
🔄 От слепого робопса до Tesla Optimus: как алгоритмы Reinforcement Learning меняют робототехнику
Stanford Online · 08.12.25
56 мин
🤖 Дорса Садик: «Почему больше данных может сделать вашего робота глупее»
Stanford Online · 13.03.24
1ч 02м
🔄 Стэнфордский курс CS224R: математический вывод градиентов политики в RL
Stanford Online · 08.12.25
1ч 07м
⚖ Методы Offline RL: от имитации к оптимизации стратегий
Stanford Online · 08.12.25
50 мин
🎮 Как ошибка в медиане влияет на оценку ИИ
The TWIML AI Podcast · 14.02.22
1ч 20м
🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности
Stanford Online · 30.10.24
1ч 19м
🚀 Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»
Stanford Online · 30.10.24
50 мин
🚀 Mobileye представила EyeQ Ultra: чип для беспилотников 4-го уровня всего за $1000
TechTechPotato · 04.01.22
1ч 18м
🛠 От PPO до Dagger: современные методы обучения агентов
Stanford Online · 30.10.24
1ч 44м
🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?
Stanford Online · 31.10.25
1ч 36м
🚀 Эйсо Кант: «Вы не сможете дообучить свой путь к AGI»
Machine Learning Street Talk · 02.04.25
1ч 25м
🧠 Камьяр Азиззаденешели: интеграция LLM и алгоритмов AlphaGo определит будущее робототехники
The TWIML AI Podcast · 05.02.24
2ч 10м
🧠 Искусственный интеллект: за пределами мифов о разумности
Lex Fridman · 26.07.22
1ч 18м
🎯 Юньчжу Ли на CS231N: от моделей мира к большим моделям поведения
Stanford Online · 02.09.25
1ч 10м
🤖 Курс CS224R в Стэнфорде: разбор многозадачного RL и алгоритма Hindsight Relabeling
Stanford Online · 08.12.25
2ч 32м
🧠 Биологический загрузчик: наше будущее в эпоху сверхразума
PowerfulJRE · 12.09.19
45 мин
🌍 Семинар в Стэнфорде: безопасное и эффективное обучение ИИ в физическом мире
Stanford Online · 19.04.24
28 мин
🤖 Как обучить робота-дворцкого? Новые подходы Стэнфорда к обобщению задач
Stanford Online · 14.07.25
2ч 29м
🧠 ИИ, дзен и свобода: как мы будем жить в автоматизированном будущем
Machine Learning Street Talk · 18.11.24
28 мин
🤖 Как система SayCan от Google объединяет нейросети и робототехнику
Yannic Kilcher · 30.04.22
1ч 15м
🍳 Надия Фигероа представила метод управления роботами через динамические системы
Stanford Online · 17.12.25