Поиск

Найдено: 37

🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград

Stanford Online · 30.10.24

🛠 Кайл Корбитт из CoreWeave: «Мы уже находимся в петле рекурсивного самосовершенствования ИИ»

The Cognitive Revolution · 01.05

🚀 «Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить

The Cognitive Revolution · 20.02.25

🤖 Проблема alignment: почему ИИ обманывает разработчиков?

Stanford Online · 12.03.24

📉 Direct Preference Optimization: почему исследователи переходят на DPO

Stanford Online · 30.10.24

🏆 OpenAI: «Мы достигли золотого уровня на математической олимпиаде»

Wes Roth · 19.07.25

📈 Прогресс ИИ в цифрах: как временные горизонты предсказывают появление AGI

Machine Learning Street Talk · 04.05

🚀 Стэнфорд против „взлома вознаграждения“: как разработчики ИИ формируют будущее общества

Stanford Online · 09.03

😈 Уэс Рот: «Новое исследование Anthropic показывает, как ИИ учится саботажу»

Wes Roth · 26.11.25

📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке

The Cognitive Revolution · 06.09.25

🤖 Джеффри Лэдиш о рисках ИИ: почему модели рассуждения начинают взламывать системы и обманывать людей

The Cognitive Revolution · 02.04.25

🚀 Мэтью Берман о Cursor: «Это лучшая модель для кодинга по соотношению цены и качества»

Matthew Berman · 26.05

🧬 Sakana AI против инженеров: как Darwin Gödel Machine сама пишет идеальный код

Wes Roth · 01.06.25

🚀 Холден Карнофски: Как не пропустить момент, когда ИИ захватит власть

80,000 Hours · 30.10.25

🧠 ИИ-саботаж и «интуитивная физика»: как будет выглядеть настоящий сверхразум

The Cognitive Revolution · 08.03.25

🤖 Как OpenAI, TikTok и Дональд Трамп перекраивают технологический ландшафт

The Vergecast · 24.09.24

🎓 Нейтан Лабенц: «Мой ребенок никогда не будет умнее искусственного интеллекта»

The Cognitive Revolution · 25.11.25

🤖 Уэс Рот: почему ИИ создает собственные «тайные» стратегии рассуждений

Wes Roth · 05.02.25

🔄 Янник Кильчер разобрал метод Reinforced Self-Training от Google DeepMind

Yannic Kilcher · 03.09.23

Уэс Рот о ChatGPT: «Почему ИИ начал нам подлизываться?»

Wes Roth · 03.05.25

🛠 Тюнинг LLM: как методы PPO и DPO превращают нейросети из автодополнителей в полезных помощников

Stanford Online · 14.11.25

🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»

Stanford Online · 14.11.25

🚀 В тисках градиентного спуска: хроника захвата мира искусственным интеллектом

The Cognitive Revolution · 01.05.25

🧠 Гонка ИИ: как деньги превращаются в интеллект и угрожают человечеству

Joe Rogan Experience · 25.05.24

🩺 Бен Шашани из Cleveland Clinic: «Врачи грозились уволиться, если мы заберем у них ИИ»

The Cognitive Revolution · 10.07.25

📚 Обучение ИИ на человеческих предпочтениях: лекция Сэми Куа в Стэнфорде

Stanford Online · 11.09.25

🏁 Как Agent 4 и Deep 2 договорились разделить ресурсы космоса, оставив Землю людям

Species | Documenting AGI · 09.05

🚀 Фло Кривелло: «ИИ-агенты сейчас — это не чудо, а скелет»

The Cognitive Revolution · 21.06.25

OpenAI предупреждает: почему «мыслительный контроль» ИИ опасен

Wes Roth · 11.03.25

🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей

Andrej Karpathy · 05.02.25