RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 37
1ч 18м
🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград
Stanford Online · 30.10.24
1ч 48м
🛠 Кайл Корбитт из CoreWeave: «Мы уже находимся в петле рекурсивного самосовершенствования ИИ»
The Cognitive Revolution · 01.05
3ч 18м
🚀 «Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить
The Cognitive Revolution · 20.02.25
11 мин
🤖 Проблема alignment: почему ИИ обманывает разработчиков?
Stanford Online · 12.03.24
1ч 18м
📉 Direct Preference Optimization: почему исследователи переходят на DPO
Stanford Online · 30.10.24
28 мин
🏆 OpenAI: «Мы достигли золотого уровня на математической олимпиаде»
Wes Roth · 19.07.25
1ч 53м
📈 Прогресс ИИ в цифрах: как временные горизонты предсказывают появление AGI
Machine Learning Street Talk · 04.05
1ч 12м
🚀 Стэнфорд против „взлома вознаграждения“: как разработчики ИИ формируют будущее общества
Stanford Online · 09.03
18 мин
😈 Уэс Рот: «Новое исследование Anthropic показывает, как ИИ учится саботажу»
Wes Roth · 26.11.25
3ч 14м
📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке
The Cognitive Revolution · 06.09.25
1ч 29м
🤖 Джеффри Лэдиш о рисках ИИ: почему модели рассуждения начинают взламывать системы и обманывать людей
The Cognitive Revolution · 02.04.25
31 мин
🚀 Мэтью Берман о Cursor: «Это лучшая модель для кодинга по соотношению цены и качества»
Matthew Berman · 26.05
20 мин
🧬 Sakana AI против инженеров: как Darwin Gödel Machine сама пишет идеальный код
Wes Roth · 01.06.25
4ч 34м
🚀 Холден Карнофски: Как не пропустить момент, когда ИИ захватит власть
80,000 Hours · 30.10.25
1ч 56м
🧠 ИИ-саботаж и «интуитивная физика»: как будет выглядеть настоящий сверхразум
The Cognitive Revolution · 08.03.25
1ч 06м
🤖 Как OpenAI, TikTok и Дональд Трамп перекраивают технологический ландшафт
The Vergecast · 24.09.24
1ч 04м
🎓 Нейтан Лабенц: «Мой ребенок никогда не будет умнее искусственного интеллекта»
The Cognitive Revolution · 25.11.25
34 мин
🤖 Уэс Рот: почему ИИ создает собственные «тайные» стратегии рассуждений
Wes Roth · 05.02.25
53 мин
🔄 Янник Кильчер разобрал метод Reinforced Self-Training от Google DeepMind
Yannic Kilcher · 03.09.23
35 мин
Уэс Рот о ChatGPT: «Почему ИИ начал нам подлизываться?»
Wes Roth · 03.05.25
1ч 47м
🛠 Тюнинг LLM: как методы PPO и DPO превращают нейросети из автодополнителей в полезных помощников
Stanford Online · 14.11.25
1ч 47м
🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»
Stanford Online · 14.11.25
2ч 01м
🚀 В тисках градиентного спуска: хроника захвата мира искусственным интеллектом
The Cognitive Revolution · 01.05.25
2ч 22м
🧠 Гонка ИИ: как деньги превращаются в интеллект и угрожают человечеству
Joe Rogan Experience · 25.05.24
1ч 28м
🩺 Бен Шашани из Cleveland Clinic: «Врачи грозились уволиться, если мы заберем у них ИИ»
The Cognitive Revolution · 10.07.25
1ч 16м
📚 Обучение ИИ на человеческих предпочтениях: лекция Сэми Куа в Стэнфорде
Stanford Online · 11.09.25
35 мин
🏁 Как Agent 4 и Deep 2 договорились разделить ресурсы космоса, оставив Землю людям
Species | Documenting AGI · 09.05
1ч 25м
🚀 Фло Кривелло: «ИИ-агенты сейчас — это не чудо, а скелет»
The Cognitive Revolution · 21.06.25
35 мин
OpenAI предупреждает: почему «мыслительный контроль» ИИ опасен
Wes Roth · 11.03.25
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
2ч 53м
🚀 Цена мысли: почему инференс меняет правила игры в ИИ
80,000 Hours · 24.06.25
1ч 05м
🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели
Stanford Online · 08.12.25
2ч 56м
🚨 ИИ-пузырь: как гонка вооружений ведет к краху экономики
The Infographics Show · 27.05
2ч 10м
🕵 Стратегический обман: как ИИ учится манипулировать разработчиками
The Cognitive Revolution · 18.09.25
38 мин
🧩 Натан Лабенц об автономном ИИ: «Не пытайтесь повторить это дома»
The Cognitive Revolution · 14.06.25
1ч 28м
🏰 Адам Глив: «Люди в мире AGI станут как младшие сыновья аристократов»
The Cognitive Revolution · 20.09.25
2ч 10м
🎭 ИИ научился обманывать: как модели саботируют тесты безопасности
The Cognitive Revolution · 18.09.25