Эмма Бранскилл

Удивление от успеха RL

«Это должно быть своего рода шокирующим, что обучение с подкреплением вообще работает.»

→ Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»

Суть обучения на опыте

«Идея в том, чтобы автоматизированный агент обучался на опыте принимать хорошие решения.»

→ Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»

Интеллект как принятие решений

«Интеллект — это не только восприятие, но и умение принимать решения.»

→ Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»

Марковское свойство систем

«Будущее независимо от прошлого, если известно настоящее.»

→ Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»

ИИ как дополнение человека

«Самые ценные инструменты дополняют человеческие способности и открывают новые горизонты возможностей.»

→ Как ИИ-агенты меняют программирование: взгляд экспертов из Anthropic и Стэнфорда

«Мы не меняем мозг, когда выполняем разные задачи, но имеем один и тот же алгоритм обучения.»

→ Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»

«Теоретические границы, хотя официально и подтверждают статус PAC-алгоритма, могут быть очень консервативными в оценке количества возможных ошибок.»

→ Профессор Эмма Бранскилл об эволюции алгоритмов исследования в обучении с подкреплением

«Трансформер поймет, что может более компактно закодировать структуру, и при развертывании на новой задаче вы получите поведение, будто вы передали ему эту неизвестную структуру.»

→ Профессор Эмма Бранскилл об эволюции алгоритмов исследования в обучении с подкреплением

Эмма Бранскилл

💬 Заметные цитаты

👥 Часто вместе с

📺 Где появляется

🧠 Ключевые концепции

🎬 Упомянутые фильмы

📺 Материалы с участием