RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 50
22 мин
🤖 Заменяет ли простая аугментация годы исследований в сфере RL?
Yannic Kilcher · 06.05.20
26 мин
🔄 Шмидхубер выворачивает ИИ наизнанку: детальный разбор концепции Upside-Down RL
Yannic Kilcher · 11.12.19
17 мин
🚀 Уэс Рот о новой революции в RL: «Эра компактных и дешевых учителей ИИ настала»
Wes Roth · 23.06.25
49 мин
⚖ Лекция в Стэнфорде: развитие интеллекта роботов через RL
Stanford Online · 08.12.25
28 мин
CURL: обучение ИИ на «сырых» пикселях без учителя
Yannic Kilcher · 11.04.20
37 мин
🧠 Гокул Свами: «Многие маршруты в Google Maps рассчитываются через инверсное обучение с подкреплением»
The TWIML AI Podcast · 21.08.23
1ч 07м
🤖 Сергей Левин об эволюции обучения с подкреплением: от «бандитов» в ChatGPT до роботов-трансформеров
The TWIML AI Podcast · 16.01.23
2ч 45м
🧠 Байесовская механика: как ИИ учится выживать и «мыслить»
Machine Learning Street Talk · 22.10.24
1ч 20м
🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности
Stanford Online · 30.10.24
1ч 12м
DREAM: как научить ИИ исследовать и обучаться эффективнее
Stanford Online · 08.12.25
34 мин
🌍 Дарио Амодеи: «К 2027 году ИИ превзойдет большинство людей»
Wes Roth · 30.01.25
17 мин
🥇 Математический триумф ИИ: детали победы Gemini DeepThink и OpenAI на IMO
Wes Roth · 21.07.25
1ч 25м
🧠 Камьяр Азиззаденешели: интеграция LLM и алгоритмов AlphaGo определит будущее робототехники
The TWIML AI Podcast · 05.02.24
1ч 03м
🤖 Пирамида данных для манипуляций: как Stanford обучает роботов сложному поведению
Stanford Online · 31.10.25
38 мин
🤖 Абхишек Гупта: «Мы должны выпустить роботов из лабораторий в наши дома»
The TWIML AI Podcast · 25.03.21
1ч 18м
🛠 От PPO до Dagger: современные методы обучения агентов
Stanford Online · 30.10.24
24 мин
🎮 Почему ИИ учится неделями, а человек адаптируется мгновенно?
Yannic Kilcher · 10.05.19
1ч 18м
🤖 От случайного блуждания до Q-Learning: как ИИ учится на своих ошибках
Stanford Online · 09.03
29 мин
Янник Килчер: как заставить роботов «думать на ходу»?
Yannic Kilcher · 23.04.20
24 мин
🧠 Сэм Альтман: «Сверхчеловеческий ИИ-кодер появится к концу 2025 года»
Wes Roth · 12.02.25
3ч 14м
📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке
The Cognitive Revolution · 06.09.25
29 мин
🚀 Почему Grok 4 Fast в 47 раз дешевле конкурентов: разбор стратегии xAI
Wes Roth · 20.09.25
54 мин
🚀 Эван Рейзер (Poolside): «Обучение на исполнении кода — это путь к созданию AGI»
Eye on AI · 24.09.25
20 мин
🧠 Вес Рот о Grok 4.20: «Четыре агента спорят друг с другом перед ответом»
Wes Roth · 17.02
50 мин
🤝 Скотт Ву (Cognition) о сделке с Windsurf и будущем ИИ-агентов
20VC (Harry Stebbings) · 18.07.25
1ч 08м
🤖 Санбэ Ким: «Языковые модели не решат проблемы робототехники»
Stanford Online · 07.03.25
1ч 05м
🎓 Анджни Мидха: «Чипы сегодня — это не товар, а дефицит, цена которого только растет»
Stanford Online · 30.04
39 мин
🎙 Уэс Рот и экс-директора Google: как самообучение ИИ без участия человека изменит индустрию
Wes Roth · 13.05.25
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
1ч 16м
Механика обучения моделей: лектор Стэнфорда о GRPO
Stanford Online · 08.07.25
13 мин
🚀 Технический разбор DeepSeek: почему китайская модель R1 стоит в разы дешевле аналогов
Y Combinator · 05.02.25
1ч 48м
🛠 Кайл Корбитт из CoreWeave: «Мы уже находимся в петле рекурсивного самосовершенствования ИИ»
The Cognitive Revolution · 01.05
45 мин
🚀 Опыт Cursor и Fireworks: распределенная инфраструктура для RL-обучения Composer 2
Sequoia Capital · 26.05
25 мин
🚀 Уэс Рот о DeepSeek R1: китайский прорыв к сильному ИИ через самоэволюцию
Wes Roth · 21.01.25
5ч 06м
🧠 DeepSeek: Как китайский хедж-фонд взломал монополию Кремниевой долины
Lex Fridman · 03.02.25
17 мин
🧠 Янник Килчер: «Эджлорды из Discord обошли техногигантов в демократизации ИИ»
Yannic Kilcher · 16.06.21
1ч 36м
🛑 Эйсо Кант: «Вы не придете к AGI с помощью файн-тюнинга»
Machine Learning Street Talk · 02.04.25
53 мин
🧠 Марк Чен и Якуб Пахоцкий раскрыли долгосрочную стратегию OpenAI
a16z (Andreessen Horowitz) · 25.09.25
2ч 13м
🚀 Экономика кремния: как физика памяти ограничивает развитие ИИ
Dwarkesh Patel · 29.04
12 мин
🤖 Прорыв из Беркли: как языковые модели обучаются без внешней оценки через метод Intuititor
Wes Roth · 17.06.25
1ч 13м
🧠 Лекция Stanford CS221: От табличных методов к Actor-Critic
Stanford Online · 09.03
53 мин
🧠 Эра Vibe Coding: как лидеры OpenAI Марк Чен и Якуб Пахоцкий меняют разработку ИИ
a16z · 25.09.25
2ч 52м
🚀 Тираны эффективности: как ИИ перекраивает экономику и жизнь
Nikhil Kamath · 29.08.25
2ч 35м
🧠 Путь к безопасному ИИ: от имитации к объективной реальности
80,000 Hours · 07.05
59 мин
🧠 Педро Домингос: «Современный успех ИИ — это локальный оптимум, а не финал»
Eye on AI · 17.04.25
51 мин
🚀 Ричард Сохер: «Мы строим поисковик, который понимает ваши намерения»
The TWIML AI Podcast · 11.07.22
58 мин
🎓 Гурдип Полл из Microsoft: «Мы строим Windows для автономных систем»
The TWIML AI Podcast · 01.02.21
47 мин
🕹 Как классическая игра NetHack помогает обучать нейросети будущего
The TWIML AI Podcast · 14.10.21
1ч 15м
🤖 Как алгоритмы Стэнфорда находят скрытые уязвимости в критических системах
Stanford Online · 07.04.25
10 мин
🧩 Обучение с подкреплением от Google: как вспомогательные задачи решают проблему редких наград
Yannic Kilcher · 28.08.17