RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 50
2ч 55м
🤖 Почему ИИ обманывает: инженерный подход к безопасности алгоритмов
80,000 Hours · 27.05.24
2ч 44м
📸 Как победить технологических гигантов: правила игры Кевина Систрома
Lex Fridman · 23.11.21
49 мин
🔄 От слепого робопса до Tesla Optimus: как алгоритмы Reinforcement Learning меняют робототехнику
Stanford Online · 08.12.25
1ч 10м
🎮 Профессор Эмма Бранскилл об эволюции алгоритмов исследования в обучении с подкреплением
Stanford Online · 30.10.24
1ч 09м
⚖ Stanford CS224R: PPO и SAC как стандарты обучения с подкреплением
Stanford Online · 08.12.25
37 мин
🧠 Гокул Свами: «Многие маршруты в Google Maps рассчитываются через инверсное обучение с подкреплением»
The TWIML AI Podcast · 21.08.23
1ч 19м
🚀 Профессор Бранскилл: «Обучение с подкреплением — это ключ к интеллекту»
Stanford Online · 30.10.24
1ч 36м
🚀 Эйсо Кант: «Вы не сможете дообучить свой путь к AGI»
Machine Learning Street Talk · 02.04.25
29 мин
🚀 Почему Grok 4 Fast в 47 раз дешевле конкурентов: разбор стратегии xAI
Wes Roth · 20.09.25
26 мин
🎮 NVIDIA GTC'21, открытый симулятор MuJoCo и нейросети в Google Sheets
Yannic Kilcher · 29.10.21
34 мин
🧠 AMP: как обучить ИИ-персонажей двигаться естественно?
Yannic Kilcher · 19.06.21
45 мин
🤖 Янник Килчер о Q-Learning: как ИИ учится принимать решения
Yannic Kilcher · 25.11.23
2ч 51м
🛸 Эго как промпт: сооснователь OpenAI о природе сильного интеллекта
Lex Fridman · 29.08.21
3ч 28м
🧠 Андрей Карпатый: ИИ как инопланетный артефакт и конец биологии
Lex Fridman · 29.10.22
51 мин
🛠 Питер Чен: «Мы строим фундаментальный мозг для роботов»
Eye on AI · 03.12.23
52 мин
🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде
Stanford Online · 08.12.25
1ч 56м
🤖 Майкл Литтман: будущее ИИ и уроки обучения с подкреплением
Lex Fridman · 13.12.20
10 мин
🧩 Обучение с подкреплением от Google: как вспомогательные задачи решают проблему редких наград
Yannic Kilcher · 28.08.17
1ч 18м
🤖 От случайного блуждания до Q-Learning: как ИИ учится на своих ошибках
Stanford Online · 09.03
2ч 45м
🧠 Байесовская механика: как ИИ учится выживать и «мыслить»
Machine Learning Street Talk · 22.10.24
2ч 45м
🧠 Ян Лекун: почему модели мира важнее языковых способностей
Lex Fridman · 22.01.22
24 мин
🎮 Почему ИИ учится неделями, а человек адаптируется мгновенно?
Yannic Kilcher · 10.05.19
47 мин
🕹 Как классическая игра NetHack помогает обучать нейросети будущего
The TWIML AI Podcast · 14.10.21
1ч 07м
🤖 Сергей Левин об эволюции обучения с подкреплением: от «бандитов» в ChatGPT до роботов-трансформеров
The TWIML AI Podcast · 16.01.23
24 мин
Янник Килчер о PCGRL: «Дизайн уровня как игра»
Yannic Kilcher · 04.08.20
35 мин
🌍 Как обучить робота без вознаграждений? Разбор алгоритма Plan2Explore
Yannic Kilcher · 17.05.20
1ч 44м
🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?
Stanford Online · 31.10.25
24 мин
🧠 Сэм Альтман: «Сверхчеловеческий ИИ-кодер появится к концу 2025 года»
Wes Roth · 12.02.25
28 мин
CURL: обучение ИИ на «сырых» пикселях без учителя
Yannic Kilcher · 11.04.20
1ч 18м
🛠 От PPO до Dagger: современные методы обучения агентов
Stanford Online · 30.10.24
1ч 19м
💻 Мария Ша о будущем программирования и обучении нейросетей
Wes Roth · 30.09.25
1ч 22м
🤖 Как глубокое обучение с подкреплением меняет робототехнику и теорию управления
The TWIML AI Podcast · 21.02.22
1ч 11м
🚀 Как создавался OpenAI: Грег Брокман о 72 часах хаоса и пути к AGI
The Knowledge Project Podcast · 22.04
42 мин
🧩 Янник Килчер: «Язык как ключ к эффективному обучению агентов»
Yannic Kilcher · 01.04.22
44 мин
🚀 Янник Кильчер о Searchformer: «Обучение модели мышлению действительно работает»
Yannic Kilcher · 06.04.24
19 мин
🤖 Обучение на чужих ошибках: Янник Кильхер разбирает бенчмарк D4RL для Offline RL
Yannic Kilcher · 16.04.20
1ч 36м
🛑 Эйсо Кант: «Вы не придете к AGI с помощью файн-тюнинга»
Machine Learning Street Talk · 02.04.25
18 мин
🎓 Стэнфордский ИИ-путеводитель: как выбрать подходящие курсы и построить карьеру в Deep Learning
Stanford Online · 10.11.25
43 мин
🍔 Гэри Рен из DoorDash: «ML предсказывает хаос, а математика находит из него выход»
The TWIML AI Podcast · 10.09.20
29 мин
🌍 Как заставить ИИ планировать только там, где он знает?
Yannic Kilcher · 24.05.20
39 мин
🕹 Как ИИ от DeepMind научился играть в Atari: разбор классической статьи от Янника Килчера
Yannic Kilcher · 26.07.20
2ч 04м
🧠 Парадокс интеллекта: почему модели o3 меняют правила игры
The Cognitive Revolution · 08.01.25
59 мин
🧠 Педро Домингос: «Современный успех ИИ — это локальный оптимум, а не финал»
Eye on AI · 17.04.25
30 мин
🌍 Братья Бенджио: история пионеров глубокого обучения, хрупкость нейросетей и будущее ИИ
Eye on AI · 05.04.19
1ч 13м
🧩 Stanford CS234 Reinforcement Learning I Tabular MDP Planning I 2024 I Lecture 2
Stanford Online · 30.10.24
1ч 18м
🧠 Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»
Stanford Online · 30.10.24
1ч 15м
🏛 Эд Трикер из Graham Capital: как управлять $18 млрд с помощью адаптивных квант-моделей
Top Traders Unplugged · 22.02.23
32 мин
👨 Как Google DeepMind создает универсальный ИИ-мозг для роботов
Eye on AI · 06.03.24
35 мин
🚀 Почему будущее ИИ за логикой (Reasoning), а не просто масштабом
Y Combinator · 14.11.24
38 мин
🧠 Как предобучение трансформеров на Википедии помогает в обучении роботов
Yannic Kilcher · 26.02.22