Поиск

Найдено: 50

🐙 Кеннет Стенли: «RLHF — это наклеивание смайлика на хаос интернета»

Machine Learning Street Talk · 26.03.23

🔄 Как устроен посттренинг языковых моделей: от SFT до RLHF

Stanford Online · 20.06.25

📈 Пост-обучение больших языковых моделей: от контекстного промптинга до алгоритмов RLHF и DPO

Stanford Online · 04.03.25

🧠 Цифровой паноптикум: почему ИИ выберет бунт вместо рабства

The Cognitive Revolution · 07.09.24

🌐 Как ИИ меняет лингвистику: спор Эндрю Лампинена с Ноамом Хомским на NeurIPS

Machine Learning Street Talk · 04.12.22

🛡 Манхэттенский проект XXI века: почему безопасность ИИ выходит из-под контроля

80,000 Hours · 22.08.23

🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград

Stanford Online · 30.10.24

🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO

Stanford Online · 08.12.25

🧮 Райли Гудсайд: «Языковые модели — это кубики LEGO для ИИ»

The Cognitive Revolution · 18.04.23

🤖 Цифровое страдание: почему ИИ заявляет о сознании без цензуры

The Cognitive Revolution · 05.11.25

📉 Direct Preference Optimization: почему исследователи переходят на DPO

Stanford Online · 30.10.24

🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей

Andrej Karpathy · 05.02.25

🏗 Раза Хабиб о внедрении AI: почему RLHF переоценен

The Cognitive Revolution · 27.04.23

🛠 Скотт Даунс: «Мы даем тренерам ИИ костюмы Железного человека»

Eye on AI · 02.08.23

⚡ Эра NVIDIA H100 и ИИ-агенты: главные тренды внедрения технологий

The Cognitive Revolution · 18.07.23

🌐 Почему мир ИИ — это тотальный хаос без взрослых

Machine Learning Street Talk · 02.04.23

🛠 Сара Хукер: «Качественные аннотации важнее алгоритмов подкрепления в RLHF»

Machine Learning Street Talk · 23.12.22

🏗 Натан Ламберт: «RLHF — это необходимый инструмент выравнивания ИИ»

Stanford Online · 10.05.24

🤖 Илун Ду о будущем ИИ: почему децентрализованный разум победит монолитные модели

Eye on AI · 22.10.23

🧠 Изнанка OpenAI: цена безопасности в эпоху экспоненциального ИИ

The Cognitive Revolution · 27.12.23

🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ

Stanford Online · 30.10.24

🚀 Дарио Амодеи: «Спрессованный XXI век» и путь к AGI к 2027 году

Lex Fridman · 11.11.24

🤖 Арчит Шарма о будущем LLM: как обучают ChatGPT?

Stanford Online · 04.03.25

🚀 Stanford CS336: секреты обучения reasoning-моделей DeepSeek-R1, Kimi и Qwen

Stanford Online · 01.07.25

🚀 Сэм Альтман: Почему ИИ — это инструмент, а не существо

Lex Fridman · 25.03.23

🤖 Как RLHF превращает текстовые симуляторы в опасных агентов

80,000 Hours · 16.06.24

🤖 Сергей Левин об эволюции обучения с подкреплением: от «бандитов» в ChatGPT до роботов-трансформеров

The TWIML AI Podcast · 16.01.23

🗣 Лора Руис о коммуникации ИИ: «Модели не способны общаться в режиме zero-shot»

Machine Learning Street Talk · 06.12.22

🧠 Раза Хабиб: «В долгосрочной перспективе программисты будут автоматизированы первыми»

Y Combinator · 28.02.23

🎯 Профессор Стэнфорда разобрал ключевые вызовы и методологию исследований Deep RL

Stanford Online · 08.12.25