RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 50
2ч 55м
🤖 Почему ИИ обманывает: инженерный подход к безопасности алгоритмов
80,000 Hours · 27.05.24
1ч 19м
🚀 Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»
Stanford Online · 30.10.24
52 мин
🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде
Stanford Online · 08.12.25
1ч 37м
🧠 Почему роботы бьют посуду и как ИИ обретает здравый смысл
Lex Fridman · 14.07.20
24 мин
🎮 Почему ИИ учится неделями, а человек адаптируется мгновенно?
Yannic Kilcher · 10.05.19
2ч 35м
🧠 Путь к безопасному ИИ: от имитации к объективной реальности
80,000 Hours · 07.05
37 мин
🧠 Гокул Свами: «Многие маршруты в Google Maps рассчитываются через инверсное обучение с подкреплением»
The TWIML AI Podcast · 21.08.23
3ч 14м
📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке
The Cognitive Revolution · 06.09.25
49 мин
🔄 От слепого робопса до Tesla Optimus: как алгоритмы Reinforcement Learning меняют робототехнику
Stanford Online · 08.12.25
45 мин
🚀 Опыт Cursor и Fireworks: распределенная инфраструктура для RL-обучения Composer 2
Sequoia Capital · 26.05
1ч 09м
🧠 Обучение с подкреплением: главные вызовы и прорывы стэнфордского курса CS234
Stanford Online · 30.10.24
40 мин
🤖 Absolute Zero: как ИИ учится программировать без людей и почему ученых пугает «uh-oh момент»
Wes Roth · 09.05.25
52 мин
🧠 Как научить ИИ думать абстракциями: гид по непрерывному RL
The TWIML AI Podcast · 11.04.22
1ч 13м
🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ
Stanford Online · 30.10.24
1ч 44м
🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?
Stanford Online · 31.10.25
1ч 10м
🎮 Профессор Эмма Бранскилл об эволюции алгоритмов исследования в обучении с подкреплением
Stanford Online · 30.10.24
1ч 14м
🚀 Тим Скарфе: «Почему самообучение нейросетей эффективнее человеческой разметки?»
Machine Learning Street Talk · 17.04.20
49 мин
🎯 Мэтью Лодж: «Большие языковые модели жертвуют точностью ради универсальности»
Eye on AI · 19.07.23
1ч 56м
🤖 Майкл Литтман: будущее ИИ и уроки обучения с подкреплением
Lex Fridman · 13.12.20
49 мин
⚖ Лекция в Стэнфорде: развитие интеллекта роботов через RL
Stanford Online · 08.12.25
1ч 25м
🧬 Том Захави: «Обучение с подкреплением — самый общий фреймворк для AGI»
Machine Learning Street Talk · 23.03.21
1ч 22м
🤖 Как глубокое обучение с подкреплением меняет робототехнику и теорию управления
The TWIML AI Podcast · 21.02.22
39 мин
🕹 Как ИИ от DeepMind научился играть в Atari: разбор классической статьи от Янника Килчера
Yannic Kilcher · 26.07.20
1ч 25м
🧠 Камьяр Азиззаденешели: интеграция LLM и алгоритмов AlphaGo определит будущее робототехники
The TWIML AI Podcast · 05.02.24
1ч 05м
🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели
Stanford Online · 08.12.25
2ч
🧠 Почему искусственные нейросети пугающе похожи на мозг
Lex Fridman · 03.07.20
20 мин
🌐 Как ИИ меняет лингвистику: спор Эндрю Лампинена с Ноамом Хомским на NeurIPS
Machine Learning Street Talk · 04.12.22
53 мин
🧠 Марк Чен и Якуб Пахоцкий раскрыли долгосрочную стратегию OpenAI
a16z (Andreessen Horowitz) · 25.09.25
2ч 44м
📸 Как победить технологических гигантов: правила игры Кевина Систрома
Lex Fridman · 23.11.21
2ч 10м
🎭 ИИ научился обманывать: как модели саботируют тесты безопасности
The Cognitive Revolution · 18.09.25
1ч 03м
🤖 Пирамида данных для манипуляций: как Stanford обучает роботов сложному поведению
Stanford Online · 31.10.25
2ч 10м
🕵 Стратегический обман: как ИИ учится манипулировать разработчиками
The Cognitive Revolution · 18.09.25
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
23 мин
🧠 Прорыв в Беркли: как ученые воссоздали технологии DeepSeek R1 за $30
Wes Roth · 31.01.25
1ч 09м
⚖ Stanford CS224R: PPO и SAC как стандарты обучения с подкреплением
Stanford Online · 08.12.25
30 мин
🧠 Ян Лекун и Рэндалл Балестриеро: «Обучение с подкреплением неэффективно»
Machine Learning Street Talk · 11.12.22
18 мин
🧱 Как Salesforce Research ускоряет иерархическое обучение с подкреплением через World Graphs
Yannic Kilcher · 08.08.19
1ч 07м
🤖 Сергей Левин об эволюции обучения с подкреплением: от «бандитов» в ChatGPT до роботов-трансформеров
The TWIML AI Podcast · 16.01.23
10 мин
🧩 Обучение с подкреплением от Google: как вспомогательные задачи решают проблему редких наград
Yannic Kilcher · 28.08.17
1ч 10м
🎯 Профессор Стэнфорда разобрал ключевые вызовы и методологию исследований Deep RL
Stanford Online · 08.12.25
55 мин
🧠 Как решать новые задачи в RL без переобучения: разбор Янника Килчера
Yannic Kilcher · 23.08.20
54 мин
🎥 Ян Лекун: «AGI не существует, человеческий интеллект специализирован»
Eye on AI · 20.10.22
25 мин
🚀 Илон Маск: «Colossus 2 и Grok 5 станут ключом к достижению AGI»
Wes Roth · 24.08.25
35 мин
🧠 Разбор гипотезы Сильвера и Саттона о достаточности награды для ИИ
Yannic Kilcher · 31.05.21
2ч 37м
🧠 Феномен AlphaGo: как сжать бесконечный поиск в нейросеть
Dwarkesh Patel · 15.05
47 мин
💰 Гордон Ирлам: почему «правило 4%» проигрывает машинному обучению
Rational Reminder · 02.09.21
34 мин
🌍 Дарио Амодеи: «К 2027 году ИИ превзойдет большинство людей»
Wes Roth · 30.01.25
55 мин
🤖 Илун Ду о будущем ИИ: почему децентрализованный разум победит монолитные модели
Eye on AI · 22.10.23
2ч 01м
🚀 В тисках градиентного спуска: хроника захвата мира искусственным интеллектом
The Cognitive Revolution · 01.05.25
1ч 15м
🤖 Как алгоритмы Стэнфорда находят скрытые уязвимости в критических системах
Stanford Online · 07.04.25