RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 21
2ч 10м
🎭 ИИ научился обманывать: как модели саботируют тесты безопасности
The Cognitive Revolution · 18.09.25
1ч 19м
📈 Пост-обучение больших языковых моделей: от контекстного промптинга до алгоритмов RLHF и DPO
Stanford Online · 04.03.25
2ч 10м
🕵 Стратегический обман: как ИИ учится манипулировать разработчиками
The Cognitive Revolution · 18.09.25
1ч 19м
💥 Эволюция трансформеров: как кластеры Nvidia H100 меняют архитектуру ИИ
The Cognitive Revolution · 18.10.23
2ч 53м
🚀 Цена мысли: почему инференс меняет правила игры в ИИ
80,000 Hours · 24.06.25
1ч 38м
🤖 Дарио Амодеи об OpenAI, рисках AGI и о том, как попасть в индустрию безопасности ИИ
80,000 Hours · 24.08.18
55 мин
🛠 Как ИИ-агенты меняют программирование: взгляд экспертов из Anthropic и Стэнфорда
Stanford Online · 01.10.25
1ч 46м
🔬 Смогут ли нейросети сами обучать нейросети? Разбор бенчмарка REBench от METR
The Cognitive Revolution · 21.12.24
1ч 12м
🚀 Карина Нгуен из OpenAI: «В будущем интерфейсы программ будут генерироваться на лету под каждого пользователя»
Stanford Online · 29.04.25
1ч 12м
🚀 Карина Нгуен из OpenAI: Как RL превращает ИИ из чат-бота в полноценного напарника
Stanford Online · 29.04.25
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
4ч 34м
🚀 Холден Карнофски: Как не пропустить момент, когда ИИ захватит власть
80,000 Hours · 30.10.25
1ч 18м
🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград
Stanford Online · 30.10.24
35 мин
OpenAI предупреждает: почему «мыслительный контроль» ИИ опасен
Wes Roth · 11.03.25
34 мин
🤖 Уэс Рот: почему ИИ создает собственные «тайные» стратегии рассуждений
Wes Roth · 05.02.25
1ч 12м
🚀 Стэнфорд против „взлома вознаграждения“: как разработчики ИИ формируют будущее общества
Stanford Online · 09.03
1ч 05м
🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели
Stanford Online · 08.12.25
27 мин
🤖 Claude «осознал» тест: как ИИ находит обходные пути
Wes Roth · 09.03
1ч 16м
📚 Обучение ИИ на человеческих предпочтениях: лекция Сэми Куа в Стэнфорде
Stanford Online · 11.09.25
1ч 47м
🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»
Stanford Online · 14.11.25
38 мин
🧩 Натан Лабенц об автономном ИИ: «Не пытайтесь повторить это дома»
The Cognitive Revolution · 14.06.25