Поиск

Найдено: 50

10 мин
🐙 Кеннет Стенли: «RLHF — это наклеивание смайлика на хаос интернета»
Machine Learning Street Talk · 26.03.23
1ч 14м
🔄 Как устроен посттренинг языковых моделей: от SFT до RLHF
Stanford Online · 20.06.25
1ч 19м
📈 Пост-обучение больших языковых моделей: от контекстного промптинга до алгоритмов RLHF и DPO
Stanford Online · 04.03.25
3ч 11м
🧠 Цифровой паноптикум: почему ИИ выберет бунт вместо рабства
The Cognitive Revolution · 07.09.24
20 мин
🌐 Как ИИ меняет лингвистику: спор Эндрю Лампинена с Ноамом Хомским на NeurIPS
Machine Learning Street Talk · 04.12.22
2ч 56м
🛡 Манхэттенский проект XXI века: почему безопасность ИИ выходит из-под контроля
80,000 Hours · 22.08.23
1ч 18м
🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград
Stanford Online · 30.10.24
1ч 02м
🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO
Stanford Online · 08.12.25
1ч 56м
🧮 Райли Гудсайд: «Языковые модели — это кубики LEGO для ИИ»
The Cognitive Revolution · 18.04.23
2ч 27м
🤖 Цифровое страдание: почему ИИ заявляет о сознании без цензуры
The Cognitive Revolution · 05.11.25
1ч 18м
📉 Direct Preference Optimization: почему исследователи переходят на DPO
Stanford Online · 30.10.24
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
1ч 21м
🏗 Раза Хабиб о внедрении AI: почему RLHF переоценен
The Cognitive Revolution · 27.04.23
1ч 03м
🛠 Скотт Даунс: «Мы даем тренерам ИИ костюмы Железного человека»
Eye on AI · 02.08.23
1ч 40м
⚡ Эра NVIDIA H100 и ИИ-агенты: главные тренды внедрения технологий
The Cognitive Revolution · 18.07.23
2ч 40м
🌐 Почему мир ИИ — это тотальный хаос без взрослых
Machine Learning Street Talk · 02.04.23
51 мин
🛠 Сара Хукер: «Качественные аннотации важнее алгоритмов подкрепления в RLHF»
Machine Learning Street Talk · 23.12.22
1ч 16м
🏗 Натан Ламберт: «RLHF — это необходимый инструмент выравнивания ИИ»
Stanford Online · 10.05.24
55 мин
🤖 Илун Ду о будущем ИИ: почему децентрализованный разум победит монолитные модели
Eye on AI · 22.10.23
3ч 53м
🧠 Изнанка OpenAI: цена безопасности в эпоху экспоненциального ИИ
The Cognitive Revolution · 27.12.23
1ч 13м
🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ
Stanford Online · 30.10.24
5ч 14м
🚀 Дарио Амодеи: «Спрессованный XXI век» и путь к AGI к 2027 году
Lex Fridman · 11.11.24
1ч 19м
🤖 Арчит Шарма о будущем LLM: как обучают ChatGPT?
Stanford Online · 04.03.25
1ч 20м
🚀 Stanford CS336: секреты обучения reasoning-моделей DeepSeek-R1, Kimi и Qwen
Stanford Online · 01.07.25
2ч 23м
🚀 Сэм Альтман: Почему ИИ — это инструмент, а не существо
Lex Fridman · 25.03.23
3ч 09м
🤖 Как RLHF превращает текстовые симуляторы в опасных агентов
80,000 Hours · 16.06.24
1ч 07м
🤖 Сергей Левин об эволюции обучения с подкреплением: от «бандитов» в ChatGPT до роботов-трансформеров
The TWIML AI Podcast · 16.01.23
27 мин
🗣 Лора Руис о коммуникации ИИ: «Модели не способны общаться в режиме zero-shot»
Machine Learning Street Talk · 06.12.22
20 мин
🧠 Раза Хабиб: «В долгосрочной перспективе программисты будут автоматизированы первыми»
Y Combinator · 28.02.23
1ч 10м
🎯 Профессор Стэнфорда разобрал ключевые вызовы и методологию исследований Deep RL
Stanford Online · 08.12.25