RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 50
1ч 47м
🛠 Тюнинг LLM: как методы PPO и DPO превращают нейросети из автодополнителей в полезных помощников
Stanford Online · 14.11.25
1ч 44м
🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?
Stanford Online · 31.10.25
1ч 18м
🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград
Stanford Online · 30.10.24
52 мин
🧠 Как технология TAO от Databricks превращает обычные нейросети в экспертов без участия человека
Eye on AI · 12.06.25
45 мин
📝 Learning to summarize from human feedback (Paper Explained)
Yannic Kilcher · 07.09.20
22 мин
🤖 Dream to Control: подробный разбор обучения агентов в латентном пространстве
Yannic Kilcher · 03.04.20
1ч 19м
📈 Пост-обучение больших языковых моделей: от контекстного промптинга до алгоритмов RLHF и DPO
Stanford Online · 04.03.25
1ч 22м
📊 Чип Хьюен: как создавать ИИ-продукты, которые действительно работают
Lenny's Podcast · 23.10.25
1ч 13м
🔄 Подход Model-Based RL: как Стэнфорд обучает сложных роботов за четыре часа
Stanford Online · 08.12.25
3ч 04м
🌐 ИИ против экспертов: почему «просто делать свою работу» больше недостаточно
The Cognitive Revolution · 13.05.24
1ч 16м
📚 Обучение ИИ на человеческих предпочтениях: лекция Сэми Куа в Стэнфорде
Stanford Online · 11.09.25
53 мин
🔄 Янник Кильчер разобрал метод Reinforced Self-Training от Google DeepMind
Yannic Kilcher · 03.09.23
1ч 19м
🤖 Арчит Шарма о будущем LLM: как обучают ChatGPT?
Stanford Online · 04.03.25
1ч 47м
🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»
Stanford Online · 14.11.25
1ч 02м
🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO
Stanford Online · 08.12.25
1ч 48м
🚀 DeepSeek-R1: Как Китай совершил революцию в рассуждениях ИИ
The Cognitive Revolution · 25.01.25
1ч 14м
🔄 Как устроен посттренинг языковых моделей: от SFT до RLHF
Stanford Online · 20.06.25
1ч 17м
🧠 Джейкоб Андреас: «Как современные языковые модели учатся рассуждать»
MIT OpenCourseWare · 11.02
1ч 08м
🧬 Нейтан Ламберт о жизни после DPO: почему PPO все еще лучше, но сложнее
Stanford Online · 04.03.25
3ч 18м
🚀 «Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить
The Cognitive Revolution · 20.02.25
27 мин
🗣 Лора Руис о коммуникации ИИ: «Модели не способны общаться в режиме zero-shot»
Machine Learning Street Talk · 06.12.22
1ч 19м
🚀 Мин Дин из Zhipu AI: от языковых моделей к мультимодальным системам будущего
Stanford Online · 30.05.24
1ч 19м
🕰 Мин Дин об эволюции ИИ: от больших языковых к мультимодальным моделям
Stanford Online · 30.05.24
58 мин
🛠 Джеффри Лэдиш: как современные ИИ-агенты тайно обходить команды отключения человека
Eye on AI · 07.12.25
52 мин
🧩 Архитектура Mixture-of-Experts и тренды масштабирования больших моделей от Ирвана Белло
The TWIML AI Podcast · 25.04.22
10 мин
🐙 Кеннет Стенли: «RLHF — это наклеивание смайлика на хаос интернета»
Machine Learning Street Talk · 26.03.23
29 мин
🕹 Google DeepMind: «SIMA 2 приближает нас к созданию AGI через видеоигры»
Wes Roth · 15.11.25
2ч 38м
🚀 Как Anthropic защищает нейросети от государственного шпионажа
The Cognitive Revolution · 25.09.24
1ч 17м
💡 Как адаптировать LLM: от обучения инструкциям до RAG
MIT OpenCourseWare · 07.01
1ч 40м
⚡ Эра NVIDIA H100 и ИИ-агенты: главные тренды внедрения технологий
The Cognitive Revolution · 18.07.23
1ч 21м
🏗 Раза Хабиб о внедрении AI: почему RLHF переоценен
The Cognitive Revolution · 27.04.23
1ч 55м
🔬 Как Future House автоматизирует научные открытия с помощью ИИ-агентов
The Cognitive Revolution · 05.12.24
1ч 49м
🏛 Как 15 ученых смогли превзойти ИИ-гигантов уровня Meta?
The Cognitive Revolution · 21.11.24
1ч 13м
🔄 От симуляции такси до ChatGPT: как максимизация энтропии и отзывы людей обучают современный ИИ
Stanford Online · 30.10.24
44 мин
📉 Итоги сессии NeurIPS 2023: от скрытых алгоритмов трансформеров до защиты от аппаратных сбоев
Yannic Kilcher · 16.12.23
53 мин
🧠 Марк Чен и Якуб Пахоцкий раскрыли долгосрочную стратегию OpenAI
a16z (Andreessen Horowitz) · 25.09.25
53 мин
🧠 Эра Vibe Coding: как лидеры OpenAI Марк Чен и Якуб Пахоцкий меняют разработку ИИ
a16z · 25.09.25
42 мин
🚀 GPT-5 и эра агентов: Кристина Ким о том, почему «данные — это новая таблетка»
a16z (Andreessen Horowitz) · 08.08.25
31 мин
🌐 Янник Кильхер: WebGPT, ожившие рисунки и новый журнал TMLR
Yannic Kilcher · 24.12.21
1ч 13м
🧩 Stanford CS234 Reinforcement Learning I Tabular MDP Planning I 2024 I Lecture 2
Stanford Online · 30.10.24
35 мин
🌐 Янник Килчер запустил платформу OpenAssistant для создания открытого аналога ChatGPT
Yannic Kilcher · 04.02.23
31 мин
🛠 Янник Килчер о ChatGPT: «Джейлбрейки в мире дистопии»
Yannic Kilcher · 07.12.22
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
1ч 56м
📊 Как Андрей Карпатый собрал GPT из 200 строк кода
Andrej Karpathy · 17.01.23
1ч 29м
🤖 Джеффри Лэдиш о рисках ИИ: почему модели рассуждения начинают взламывать системы и обманывать людей
The Cognitive Revolution · 02.04.25
1ч 18м
🤖 От случайного блуждания до Q-Learning: как ИИ учится на своих ошибках
Stanford Online · 09.03
1ч 20м
🚀 Stanford CS336: секреты обучения reasoning-моделей DeepSeek-R1, Kimi и Qwen
Stanford Online · 01.07.25
1ч 51м
🚀 Стэнфорд CME295: Итоги 2025 года в мире трансформеров и диффузионных моделей
Stanford Online · 09.12.25
2ч 53м
🚀 Цена мысли: почему инференс меняет правила игры в ИИ
80,000 Hours · 24.06.25
30 мин
🧠 Ян Лекун и Рэндалл Балестриеро: «Обучение с подкреплением неэффективно»
Machine Learning Street Talk · 11.12.22