RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 50
10 мин
🐙 Кеннет Стенли: «RLHF — это наклеивание смайлика на хаос интернета»
Machine Learning Street Talk · 26.03.23
1ч 14м
🔄 Как устроен посттренинг языковых моделей: от SFT до RLHF
Stanford Online · 20.06.25
1ч 19м
📈 Пост-обучение больших языковых моделей: от контекстного промптинга до алгоритмов RLHF и DPO
Stanford Online · 04.03.25
3ч 11м
🧠 Цифровой паноптикум: почему ИИ выберет бунт вместо рабства
The Cognitive Revolution · 07.09.24
20 мин
🌐 Как ИИ меняет лингвистику: спор Эндрю Лампинена с Ноамом Хомским на NeurIPS
Machine Learning Street Talk · 04.12.22
2ч 56м
🛡 Манхэттенский проект XXI века: почему безопасность ИИ выходит из-под контроля
80,000 Hours · 22.08.23
1ч 18м
🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград
Stanford Online · 30.10.24
1ч 02м
🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO
Stanford Online · 08.12.25
1ч 56м
🧮 Райли Гудсайд: «Языковые модели — это кубики LEGO для ИИ»
The Cognitive Revolution · 18.04.23
2ч 27м
🤖 Цифровое страдание: почему ИИ заявляет о сознании без цензуры
The Cognitive Revolution · 05.11.25
1ч 18м
📉 Direct Preference Optimization: почему исследователи переходят на DPO
Stanford Online · 30.10.24
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
1ч 21м
🏗 Раза Хабиб о внедрении AI: почему RLHF переоценен
The Cognitive Revolution · 27.04.23
1ч 03м
🛠 Скотт Даунс: «Мы даем тренерам ИИ костюмы Железного человека»
Eye on AI · 02.08.23
1ч 40м
⚡ Эра NVIDIA H100 и ИИ-агенты: главные тренды внедрения технологий
The Cognitive Revolution · 18.07.23
2ч 40м
🌐 Почему мир ИИ — это тотальный хаос без взрослых
Machine Learning Street Talk · 02.04.23
51 мин
🛠 Сара Хукер: «Качественные аннотации важнее алгоритмов подкрепления в RLHF»
Machine Learning Street Talk · 23.12.22
1ч 16м
🏗 Натан Ламберт: «RLHF — это необходимый инструмент выравнивания ИИ»
Stanford Online · 10.05.24
55 мин
🤖 Илун Ду о будущем ИИ: почему децентрализованный разум победит монолитные модели
Eye on AI · 22.10.23
3ч 53м
🧠 Изнанка OpenAI: цена безопасности в эпоху экспоненциального ИИ
The Cognitive Revolution · 27.12.23
1ч 13м
🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ
Stanford Online · 30.10.24
5ч 14м
🚀 Дарио Амодеи: «Спрессованный XXI век» и путь к AGI к 2027 году
Lex Fridman · 11.11.24
1ч 19м
🤖 Арчит Шарма о будущем LLM: как обучают ChatGPT?
Stanford Online · 04.03.25
1ч 20м
🚀 Stanford CS336: секреты обучения reasoning-моделей DeepSeek-R1, Kimi и Qwen
Stanford Online · 01.07.25
2ч 23м
🚀 Сэм Альтман: Почему ИИ — это инструмент, а не существо
Lex Fridman · 25.03.23
3ч 09м
🤖 Как RLHF превращает текстовые симуляторы в опасных агентов
80,000 Hours · 16.06.24
1ч 07м
🤖 Сергей Левин об эволюции обучения с подкреплением: от «бандитов» в ChatGPT до роботов-трансформеров
The TWIML AI Podcast · 16.01.23
27 мин
🗣 Лора Руис о коммуникации ИИ: «Модели не способны общаться в режиме zero-shot»
Machine Learning Street Talk · 06.12.22
20 мин
🧠 Раза Хабиб: «В долгосрочной перспективе программисты будут автоматизированы первыми»
Y Combinator · 28.02.23
1ч 10м
🎯 Профессор Стэнфорда разобрал ключевые вызовы и методологию исследований Deep RL
Stanford Online · 08.12.25
2ч 25м
🧠 Ситуативная осведомленность ИИ: как модели учатся нас обманывать
The Cognitive Revolution · 16.10.24
1ч 21м
🧬 Основатель Gretel AI Алекс Уотсон о математических гарантиях приватности
The Cognitive Revolution · 14.11.23
1ч 20м
🧠 Стэнфордский курс CS234: принципы офлайн-RL и преодоление неопределенности
Stanford Online · 30.10.24
42 мин
🧠 Илья Суцкевер о споре с Лекуном, галлюцинациях GPT и будущем демократии
Eye on AI · 15.03.23
1ч 08м
🧬 Нейтан Ламберт о жизни после DPO: почему PPO все еще лучше, но сложнее
Stanford Online · 04.03.25
1ч 44м
🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?
Stanford Online · 31.10.25
3ч 13м
🚀 Ловушка суперчисленности: почему ИИ лишит человечество контроля
80,000 Hours · 03.08.24
20 мин
🎓 Дарио Амодеи: «Модели за $10 млрд появятся к 2025 году»
a16z (Andreessen Horowitz) · 25.09.23
1ч
🧠 Как исследователи выявляют скрытую ситуативную осведомленность у языковых моделей
Eye on AI · 05.11.23
52 мин
🧩 Архитектура Mixture-of-Experts и тренды масштабирования больших моделей от Ирвана Белло
The TWIML AI Podcast · 25.04.22
1ч 01м
🔌 Как лаборатория YerevaNN создает ИИ мирового уровня в условиях «видеокарточного голода»
Eye on AI · 09.01.24
43 мин
🧠 Илья Суцкевер: «Предсказание следующего слова — это сжатие реальности»
Eye on AI · 15.03.23
1ч 05м
🔄 Лекция Стэнфорда о Reward Learning: как научить искусственный интеллект понимать человеческие цели
Stanford Online · 08.12.25
1ч 54м
🧠 Тан Чжи Сюань: «ИИ не должен просто угадывать наши желания — он должен соблюдать социальные нормы»
The Cognitive Revolution · 30.11.24
1ч 01м
Эдвард Грефенстетт о семантике, ИИ и философии
Machine Learning Street Talk · 11.02.23
34 мин
📉 Технический разбор GPT-4: скрытые параметры, законы масштабирования и риски для бизнеса
Yannic Kilcher · 15.03.23
1ч 44м
🏗 Ян Дюбуа о создании LLM: почему данные и системы важнее архитектуры
Stanford Online · 27.08.24
3ч 17м
🤖 Элиезер Юдковский: Почему первый сверхразум станет последним событием истории
Lex Fridman · 30.03.23
2ч 16м
🚀 Аравинд Сринивас: как создать поисковик, который заменит Google
Nikhil Kamath · 23.03.25
42 мин
🛠 Как Weights & Biases наводит порядок в хаосе машинного обучения и LLM
Eye on AI · 09.06.24