Э

Эмма Бранскилл

Профессор Стэнфордского университета, ведущая лекции по обучению с подкреплением.

5статей
190 тыс.просмотров
2024–2025период
1канал

💬 Заметные цитаты

Удивление от успеха RL
«Это должно быть своего рода шокирующим, что обучение с подкреплением вообще работает.»
Суть обучения на опыте
«Идея в том, чтобы автоматизированный агент обучался на опыте принимать хорошие решения.»
Интеллект как принятие решений
«Интеллект — это не только восприятие, но и умение принимать решения.»
Марковское свойство систем
«Будущее независимо от прошлого, если известно настоящее.»
ИИ как дополнение человека
«Самые ценные инструменты дополняют человеческие способности и открывают новые горизонты возможностей.»
«Мы не меняем мозг, когда выполняем разные задачи, но имеем один и тот же алгоритм обучения.»
«Теоретические границы, хотя официально и подтверждают статус PAC-алгоритма, могут быть очень консервативными в оценке количества возможных ошибок.»
«Трансформер поймет, что может более компактно закодировать структуру, и при развертывании на новой задаче вы получите поведение, будто вы передали ему эту неизвестную структуру.»

📺 Где появляется

🎬 Упомянутые фильмы

📈 Темы Reinforcement Learning3Stanford University3CS2342DeepMind2Reward Hacking1Claude Code1ChatGPT1Q-learning1DQN1RLHF1Эмма Бранскилл1Markov Decision Processes1

📺 Материалы с участием