RDLY
.ru
Тренды
Статьи
Темы
Обучение с подкреплением
25 статей
2ч 35м
🧠 Путь к безопасному ИИ: от имитации к объективной реальности
80,000 Hours · 07.05
1ч 03м
🔄 Эволюция алгоритмов Actor-Critic: как Стэнфорд обучает нейросети на ошибках
Stanford Online · 08.12.25
1ч 02м
🔄 Стэнфордский курс CS224R: математический вывод градиентов политики в RL
Stanford Online · 08.12.25
56 мин
💎 Основатель Mariana: «Мы потеряли способность строить сложную инфраструктуру»
a16z (Andreessen Horowitz) · 23.07.25
38 мин
🧩 Натан Лабенц об автономном ИИ: «Не пытайтесь повторить это дома»
The Cognitive Revolution · 14.06.25
2ч 01м
🚀 В тисках градиентного спуска: хроника захвата мира искусственным интеллектом
The Cognitive Revolution · 01.05.25
1ч 19м
🎓 Кэл Ньюпорт: почему пятиминутный тайм-менеджмент больше не работает
Deep Questions with Cal Newport · 14.04.25
1ч 36м
🚀 Эйсо Кант: «Вы не сможете дообучить свой путь к AGI»
Machine Learning Street Talk · 02.04.25
23 мин
🧠 Прорыв в Беркли: как ученые воссоздали технологии DeepSeek R1 за $30
Wes Roth · 31.01.25
1ч 49м
🏛 Как 15 ученых смогли превзойти ИИ-гигантов уровня Meta?
The Cognitive Revolution · 21.11.24
1ч 09м
🧠 Обучение с подкреплением: главные вызовы и прорывы стэнфордского курса CS234
Stanford Online · 30.10.24
2ч 55м
🤖 Почему ИИ обманывает: инженерный подход к безопасности алгоритмов
80,000 Hours · 27.05.24
56 мин
🚀 Сергий Нестеренко: «Разводка плат должна стать похожей на компиляцию кода»
The Cognitive Revolution · 25.04.24
49 мин
🎯 Мэтью Лодж: «Большие языковые модели жертвуют точностью ради универсальности»
Eye on AI · 19.07.23
13 мин
📈 Как AlphaTensor побил 50-летний рекорд умножения матриц
Quanta Magazine · 22.05.23
8 мин
🎮 NVIDIA научила AI двигаться: 10 лет тренировок за 10 дней
Two Minute Papers · 19.07.22
58 мин
🤖 Как Google SayCan объединяет языковые модели и робототехнику
Yannic Kilcher · 02.05.22
57 мин
🌐 Минчи Цзян: «Графики метрик скрывали реальные слепые зоны агента»
Yannic Kilcher · 26.04.22
49 мин
🧭 Как естественный язык помогает ИИ исследовать сложные виртуальные миры?
Yannic Kilcher · 02.04.22
41 мин
🧠 Как научить ИИ размышлять: Андреа Банино о механизмах PonderNet
The TWIML AI Podcast · 18.10.21
35 мин
🎮 Экономика под управлением ИИ: как Salesforce научила нейросети собирать налоги
Yannic Kilcher · 30.04.20
35 мин
🎮 Янник Килчер разобрал симуляцию AI Economist: как ИИ предлагает оптимизировать налоги
Yannic Kilcher · 30.04.20
33 мин
🤖 Почему классический ИИ падает в ямы, а алгоритм POET побеждает?
Yannic Kilcher · 06.04.20
32 мин
🕹 Как Agent57 от DeepMind превзошел человека в бенчмарке Atari
Yannic Kilcher · 31.03.20
30 мин
🎮 Янник Килчер разобрал ИИ-агента LeDeepChef для текстовых игр
Yannic Kilcher · 15.10.19