Поиск

Найдено: 41

🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде

Stanford Online · 08.12.25

🤖 Имитационное обучение: почему простого копирования действий недостаточно

Stanford Online · 08.12.25

🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели

Stanford Online · 08.12.25

🛑 Эйсо Кант: «Вы не придете к AGI с помощью файн-тюнинга»

Machine Learning Street Talk · 02.04.25

🧠 Кевин Эллис и Зенна Таварес о будущем AI: почему имитации недостаточно для создания мировых моделей

Machine Learning Street Talk · 08.04.25

⚖ Лекция в Стэнфорде: развитие интеллекта роботов через RL

Stanford Online · 08.12.25

🤖 Стэнфордский курс CS224R: концепции и алгоритмы автономного обучения роботов

Stanford Online · 08.12.25

🤖 Градиент стратегии в Reinforcement Learning: от REINFORCE до Importance Sampling

Stanford Online · 08.12.25

🌐 Янник Кильхер: WebGPT, ожившие рисунки и новый журнал TMLR

Yannic Kilcher · 24.12.21

🔄 От слепого робопса до Tesla Optimus: как алгоритмы Reinforcement Learning меняют робототехнику

Stanford Online · 08.12.25

🤖 Дорса Садик: «Почему больше данных может сделать вашего робота глупее»

Stanford Online · 13.03.24

🔄 Стэнфордский курс CS224R: математический вывод градиентов политики в RL

Stanford Online · 08.12.25

⚖ Методы Offline RL: от имитации к оптимизации стратегий

Stanford Online · 08.12.25

🎮 Как ошибка в медиане влияет на оценку ИИ

The TWIML AI Podcast · 14.02.22

🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности

Stanford Online · 30.10.24

🚀 Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»

Stanford Online · 30.10.24

🚀 Mobileye представила EyeQ Ultra: чип для беспилотников 4-го уровня всего за $1000

TechTechPotato · 04.01.22

🛠 От PPO до Dagger: современные методы обучения агентов

Stanford Online · 30.10.24

🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?

Stanford Online · 31.10.25

🚀 Эйсо Кант: «Вы не сможете дообучить свой путь к AGI»

Machine Learning Street Talk · 02.04.25

🧠 Камьяр Азиззаденешели: интеграция LLM и алгоритмов AlphaGo определит будущее робототехники

The TWIML AI Podcast · 05.02.24

🧠 Искусственный интеллект: за пределами мифов о разумности

Lex Fridman · 26.07.22

🎯 Юньчжу Ли на CS231N: от моделей мира к большим моделям поведения

Stanford Online · 02.09.25

🤖 Курс CS224R в Стэнфорде: разбор многозадачного RL и алгоритма Hindsight Relabeling

Stanford Online · 08.12.25

🧠 Биологический загрузчик: наше будущее в эпоху сверхразума

PowerfulJRE · 12.09.19

🌍 Семинар в Стэнфорде: безопасное и эффективное обучение ИИ в физическом мире

Stanford Online · 19.04.24

🤖 Как обучить робота-дворцкого? Новые подходы Стэнфорда к обобщению задач

Stanford Online · 14.07.25

🧠 ИИ, дзен и свобода: как мы будем жить в автоматизированном будущем

Machine Learning Street Talk · 18.11.24

🤖 Как система SayCan от Google объединяет нейросети и робототехнику

Yannic Kilcher · 30.04.22

🍳 Надия Фигероа представила метод управления роботами через динамические системы

Stanford Online · 17.12.25