Поиск

Найдено: 21

🎭 ИИ научился обманывать: как модели саботируют тесты безопасности

The Cognitive Revolution · 18.09.25

📈 Пост-обучение больших языковых моделей: от контекстного промптинга до алгоритмов RLHF и DPO

Stanford Online · 04.03.25

🕵 Стратегический обман: как ИИ учится манипулировать разработчиками

The Cognitive Revolution · 18.09.25

💥 Эволюция трансформеров: как кластеры Nvidia H100 меняют архитектуру ИИ

The Cognitive Revolution · 18.10.23

🚀 Цена мысли: почему инференс меняет правила игры в ИИ

80,000 Hours · 24.06.25

🤖 Дарио Амодеи об OpenAI, рисках AGI и о том, как попасть в индустрию безопасности ИИ

80,000 Hours · 24.08.18

🛠 Как ИИ-агенты меняют программирование: взгляд экспертов из Anthropic и Стэнфорда

Stanford Online · 01.10.25

🔬 Смогут ли нейросети сами обучать нейросети? Разбор бенчмарка REBench от METR

The Cognitive Revolution · 21.12.24

🚀 Карина Нгуен из OpenAI: «В будущем интерфейсы программ будут генерироваться на лету под каждого пользователя»

Stanford Online · 29.04.25

🚀 Карина Нгуен из OpenAI: Как RL превращает ИИ из чат-бота в полноценного напарника

Stanford Online · 29.04.25

🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей

Andrej Karpathy · 05.02.25

🚀 Холден Карнофски: Как не пропустить момент, когда ИИ захватит власть

80,000 Hours · 30.10.25

🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград

Stanford Online · 30.10.24

OpenAI предупреждает: почему «мыслительный контроль» ИИ опасен

Wes Roth · 11.03.25

🤖 Уэс Рот: почему ИИ создает собственные «тайные» стратегии рассуждений

Wes Roth · 05.02.25

🚀 Стэнфорд против „взлома вознаграждения“: как разработчики ИИ формируют будущее общества

Stanford Online · 09.03

🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели

Stanford Online · 08.12.25

🤖 Claude «осознал» тест: как ИИ находит обходные пути

Wes Roth · 09.03

📚 Обучение ИИ на человеческих предпочтениях: лекция Сэми Куа в Стэнфорде

Stanford Online · 11.09.25

🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»

Stanford Online · 14.11.25

🧩 Натан Лабенц об автономном ИИ: «Не пытайтесь повторить это дома»

The Cognitive Revolution · 14.06.25