RLHF

61 статей

🧠 Looking Glass Universe: «Почему нейросети становятся манипуляторами?»

Looking Glass Universe · 10.07 · 18,1 тыс. просм.

🛠 Кайл Корбитт из CoreWeave: «Мы уже находимся в петле рекурсивного самосовершенствования ИИ»

The Cognitive Revolution · 01.05 · 10,4 тыс. просм.

🤖 Как устроены современные языковые модели: от обучения до системных ограничений

Stanford Online · 09.03 · 4,1 тыс. просм.

🧠 Джейкоб Андреас: «Как современные языковые модели учатся рассуждать»

MIT OpenCourseWare · 11.02 · 2,5 тыс. просм.

🧠 Уэс Рот: как «документ души» и Конституция формируют характер Claude

Wes Roth · 23.01 · 35,8 тыс. просм.

📉 Мэтт Фитцпатрик: «Внутренние ИИ-команды корпораций в два раза менее эффективны»

20VC (Harry Stebbings) · 31.12.25 · 12,7 тыс. просм.

📉 Мэтт Фицпатрик: «Внутренние ИИ-проекты корпораций обречены на провал в 95% случаев»

20VC (Harry Stebbings) · 31.12.25 · 12,7 тыс. просм.

🎯 Профессор Стэнфорда разобрал ключевые вызовы и методологию исследований Deep RL

Stanford Online · 08.12.25 · 3,4 тыс. просм.

🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели

Stanford Online · 08.12.25 · 4,2 тыс. просм.

🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO

Stanford Online · 08.12.25 · 5 тыс. просм.

🛠 Тюнинг LLM: как методы PPO и DPO превращают нейросети из автодополнителей в полезных помощников

Stanford Online · 14.11.25 · 41,1 тыс. просм.

🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»

Stanford Online · 14.11.25 · 41,1 тыс. просм.

🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?

Stanford Online · 31.10.25 · 36 тыс. просм.

📊 Чип Хьюен: как создавать ИИ-продукты, которые действительно работают

Lenny's Podcast · 23.10.25 · 46,4 тыс. просм.

🤖 Айзек Артур: «Проблема выравнивания ИИ — это попытка научить джинна понимать намерения»

Isaac Arthur · 16.10.25 · 34 тыс. просм.

📚 Обучение ИИ на человеческих предпочтениях: лекция Сэми Куа в Стэнфорде

Stanford Online · 11.09.25 · 81,1 тыс. просм.

🎓 Почему нейросети галлюцинируют? OpenAI нашла решение проблемы «уверенной лжи»

Wes Roth · 08.09.25 · 46,1 тыс. просм.

🌪 Эпоха фабрик данных: как CEO Labelbox строит конвейер для обучения AGI с экспертами на $250k в год

The Cognitive Revolution · 08.07.25 · 258 тыс. просм.

Механика обучения моделей: лектор Стэнфорда о GRPO

Stanford Online · 08.07.25 · 32,3 тыс. просм.

⚖ Инженерная оптимизация: как математика помогает выбирать между безопасностью и скоростью

Stanford Online · 03.07.25 · 6,9 тыс. просм.

🚀 Stanford CS336: секреты обучения reasoning-моделей DeepSeek-R1, Kimi и Qwen

Stanford Online · 01.07.25 · 35,4 тыс. просм.

🔄 Как устроен посттренинг языковых моделей: от SFT до RLHF

Stanford Online · 20.06.25 · 32,3 тыс. просм.

🚀 13 инженеров против OpenAI: как удержать миллионы пользователей ИИ

Machine Learning Street Talk · 26.05.25 · 10,1 тыс. просм.

Генеративный ИИ в медицине: как работают большие языковые модели

Stanford Online · 30.04.25 · 39,9 тыс. просм.

🧠 Макс Бартоло из Cohere: почему человеческая обратная связь — это не золотой стандарт для ИИ

Machine Learning Street Talk · 18.03.25 · 8,5 тыс. просм.

🧬 Нейтан Ламберт о жизни после DPO: почему PPO все еще лучше, но сложнее

Stanford Online · 04.03.25 · 13,1 тыс. просм.

📈 Пост-обучение больших языковых моделей: от контекстного промптинга до алгоритмов RLHF и DPO

Stanford Online · 04.03.25 · 23,4 тыс. просм.

🤖 Арчит Шарма о будущем LLM: как обучают ChatGPT?

Stanford Online · 04.03.25 · 23,4 тыс. просм.

🧠 Тан Чжи Сюань: «ИИ не должен просто угадывать наши желания — он должен соблюдать социальные нормы»

The Cognitive Revolution · 30.11.24 · 2,1 тыс. просм.

🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ

Stanford Online · 30.10.24 · 8,4 тыс. просм.