RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 50
2ч 10м
🕵 Стратегический обман: как ИИ учится манипулировать разработчиками
The Cognitive Revolution · 18.09.25
3ч 14м
📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке
The Cognitive Revolution · 06.09.25
52 мин
🧠 Как научить ИИ думать абстракциями: гид по непрерывному RL
The TWIML AI Podcast · 11.04.22
37 мин
🧠 Гокул Свами: «Многие маршруты в Google Maps рассчитываются через инверсное обучение с подкреплением»
The TWIML AI Podcast · 21.08.23
2ч 10м
🎭 ИИ научился обманывать: как модели саботируют тесты безопасности
The Cognitive Revolution · 18.09.25
2ч 35м
🧠 Путь к безопасному ИИ: от имитации к объективной реальности
80,000 Hours · 07.05
25 мин
🚀 Илон Маск: «Colossus 2 и Grok 5 станут ключом к достижению AGI»
Wes Roth · 24.08.25
2ч 37м
🧠 Феномен AlphaGo: как сжать бесконечный поиск в нейросеть
Dwarkesh Patel · 15.05
53 мин
🧠 Марк Чен и Якуб Пахоцкий раскрыли долгосрочную стратегию OpenAI
a16z (Andreessen Horowitz) · 25.09.25
1ч 25м
🧠 Камьяр Азиззаденешели: интеграция LLM и алгоритмов AlphaGo определит будущее робототехники
The TWIML AI Podcast · 05.02.24
28 мин
🤖 Как система SayCan от Google объединяет нейросети и робототехнику
Yannic Kilcher · 30.04.22
1ч 09м
🧠 Как Meta-RL позволяет агентам адаптироваться к новым задачам „на лету“
Stanford Online · 08.12.25
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
3ч 18м
🚀 «Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить
The Cognitive Revolution · 20.02.25
52 мин
🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде
Stanford Online · 08.12.25
34 мин
🤖 Уэс Рот: почему ИИ создает собственные «тайные» стратегии рассуждений
Wes Roth · 05.02.25
9 мин
🧩 Илья Суцкевер: «Зрение и язык — это одна и та же задача для ИИ»
Lex Fridman · 10.05.20
2ч 01м
🚀 В тисках градиентного спуска: хроника захвата мира искусственным интеллектом
The Cognitive Revolution · 01.05.25
58 мин
🛡 Мариус Хоббан: «У модели o1 есть базовые способности для стратегического обмана»
The Cognitive Revolution · 14.09.24
1ч 10м
🧱 Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 10: RL for LLM Reasoning
Stanford Online · 08.12.25
24 мин
🎮 Почему ИИ учится неделями, а человек адаптируется мгновенно?
Yannic Kilcher · 10.05.19
1ч 07м
⚖ Методы Offline RL: от имитации к оптимизации стратегий
Stanford Online · 08.12.25
2ч 05м
🤖 Как попасть в OpenAI без PhD за шесть недель
80,000 Hours · 31.05.19
42 мин
🚀 GPT-5 и эра агентов: Кристина Ким о том, почему «данные — это новая таблетка»
a16z (Andreessen Horowitz) · 08.08.25
44 мин
🤖 Как стартап Physical Intelligence создает универсальную модель для любых роботов
Y Combinator · 22.07.25
45 мин
🚀 Опыт Cursor и Fireworks: распределенная инфраструктура для RL-обучения Composer 2
Sequoia Capital · 26.05
2ч
🧠 Почему искусственные нейросети пугающе похожи на мозг
Lex Fridman · 03.07.20
2ч 54м
🤖 Восемь лет до сингулярности: как ИИ построит «Потемкинскую деревню»
80,000 Hours · 08.07.25
1ч 25м
🧬 Том Захави: «Обучение с подкреплением — самый общий фреймворк для AGI»
Machine Learning Street Talk · 23.03.21
1ч 47м
🧠 Стэнфорд CME295: Как алгоритм GRPO и DeepSeek R1 изменили логику нейросетей
Stanford Online · 14.11.25
34 мин
🚀 Дарио Амодеи о будущем ИИ: «Мы увидим страну гениев в одном дата-центре»
Wes Roth · 30.01.25
58 мин
🧠 Джоэль Пино из Cohere: почему законы масштабирования работают и как ИИ повысит продуктивность в 10 раз
20VC (Harry Stebbings) · 03.11.25
2ч 53м
🚀 Цена мысли: почему инференс меняет правила игры в ИИ
80,000 Hours · 24.06.25
27 мин
🧠 a16z: Как DeepSeek R1 обрушил стоимость обучения ИИ и открыл новую эру рассуждающих моделей
a16z (Andreessen Horowitz) · 05.03.25
1ч 01м
🚀 Александр Ванг: «Будущее экономики — это управление роем агентов»
Y Combinator · 18.06.25
1ч 14м
🧠 Техлид Gemini 2.5 Джек Рэй о цепочках мыслей, латентном пространстве и пути к AGI
The Cognitive Revolution · 05.04.25
1ч 02м
🔄 Стэнфордский курс CS224R: математический вывод градиентов политики в RL
Stanford Online · 08.12.25
2ч 04м
🤖 Почему мы — невыровненный ИИ: угрозы сверхразумного будущего
Machine Learning Street Talk · 01.11.20
1ч 33м
🌊 Йошуа Бенжио: «GFlowNets — это обучаемая замена методам Монте-Карло»
Machine Learning Street Talk · 22.02.22
55 мин
🧠 Как решать новые задачи в RL без переобучения: разбор Янника Килчера
Yannic Kilcher · 23.08.20
1ч
🚨 Лирон Шапира об ИИ-гонке: «Вызвать демона легче, чем им управлять»
Wes Roth · 02.10.25
17 мин
🤖 Джордж Хотц и Лекс Фридман: как программистские мемы объясняют устройство мира
Lex Fridman · 23.10.20
49 мин
🧠 Феномен Shortcut Learning: почему нейросети находят лазейки в данных вместо понимания
Yannic Kilcher · 18.04.20
1ч 22м
🛠 Как оптимизировать инференс языковых моделей: от архитектуры до vLLM
Stanford Online · 19.05.25
1ч 48м
🛠 Кайл Корбитт из CoreWeave: «Мы уже находимся в петле рекурсивного самосовершенствования ИИ»
The Cognitive Revolution · 01.05
50 мин
🎮 Как ошибка в медиане влияет на оценку ИИ
The TWIML AI Podcast · 14.02.22
30 мин
🧠 Ян Лекун и Рэндалл Балестриеро: «Обучение с подкреплением неэффективно»
Machine Learning Street Talk · 11.12.22
2ч 45м
🧠 Байесовская механика: как ИИ учится выживать и «мыслить»
Machine Learning Street Talk · 22.10.24
40 мин
🤖 Absolute Zero: как ИИ учится программировать без людей и почему ученых пугает «uh-oh момент»
Wes Roth · 09.05.25
1ч 13м
🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ
Stanford Online · 30.10.24