Поиск

Найдено: 50

🤖 Почему ИИ обманывает: инженерный подход к безопасности алгоритмов

80,000 Hours · 27.05.24

🚀 Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»

Stanford Online · 30.10.24

🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде

Stanford Online · 08.12.25

🧠 Почему роботы бьют посуду и как ИИ обретает здравый смысл

Lex Fridman · 14.07.20

🎮 Почему ИИ учится неделями, а человек адаптируется мгновенно?

Yannic Kilcher · 10.05.19

🧠 Путь к безопасному ИИ: от имитации к объективной реальности

80,000 Hours · 07.05

🧠 Гокул Свами: «Многие маршруты в Google Maps рассчитываются через инверсное обучение с подкреплением»

The TWIML AI Podcast · 21.08.23

📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке

The Cognitive Revolution · 06.09.25

🔄 От слепого робопса до Tesla Optimus: как алгоритмы Reinforcement Learning меняют робототехнику

Stanford Online · 08.12.25

🚀 Опыт Cursor и Fireworks: распределенная инфраструктура для RL-обучения Composer 2

Sequoia Capital · 26.05

🧠 Обучение с подкреплением: главные вызовы и прорывы стэнфордского курса CS234

Stanford Online · 30.10.24

🤖 Absolute Zero: как ИИ учится программировать без людей и почему ученых пугает «uh-oh момент»

Wes Roth · 09.05.25

🧠 Как научить ИИ думать абстракциями: гид по непрерывному RL

The TWIML AI Podcast · 11.04.22

🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ

Stanford Online · 30.10.24

🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?

Stanford Online · 31.10.25

🎮 Профессор Эмма Бранскилл об эволюции алгоритмов исследования в обучении с подкреплением

Stanford Online · 30.10.24

🚀 Тим Скарфе: «Почему самообучение нейросетей эффективнее человеческой разметки?»

Machine Learning Street Talk · 17.04.20

🎯 Мэтью Лодж: «Большие языковые модели жертвуют точностью ради универсальности»

Eye on AI · 19.07.23

🤖 Майкл Литтман: будущее ИИ и уроки обучения с подкреплением

Lex Fridman · 13.12.20

⚖ Лекция в Стэнфорде: развитие интеллекта роботов через RL

Stanford Online · 08.12.25

🧬 Том Захави: «Обучение с подкреплением — самый общий фреймворк для AGI»

Machine Learning Street Talk · 23.03.21

🤖 Ловушка оптимизации: как ИИ учится и где ошибается

🤖 Как глубокое обучение с подкреплением меняет робототехнику и теорию управления

The TWIML AI Podcast · 21.02.22

🕹 Как ИИ от DeepMind научился играть в Atari: разбор классической статьи от Янника Килчера

Yannic Kilcher · 26.07.20

🧠 Камьяр Азиззаденешели: интеграция LLM и алгоритмов AlphaGo определит будущее робототехники

The TWIML AI Podcast · 05.02.24

🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели

Stanford Online · 08.12.25

🧠 Почему искусственные нейросети пугающе похожи на мозг

Lex Fridman · 03.07.20

🌐 Как ИИ меняет лингвистику: спор Эндрю Лампинена с Ноамом Хомским на NeurIPS

Machine Learning Street Talk · 04.12.22

🧠 Марк Чен и Якуб Пахоцкий раскрыли долгосрочную стратегию OpenAI

a16z (Andreessen Horowitz) · 25.09.25

📸 Как победить технологических гигантов: правила игры Кевина Систрома

Lex Fridman · 23.11.21