Поиск

Найдено: 50

🛠 Тюнинг LLM: как методы PPO и DPO превращают нейросети из автодополнителей в полезных помощников

Stanford Online · 14.11.25

🎮 От Atari до ChatGPT: как ИИ учится на своих ошибках?

Stanford Online · 31.10.25

💡 Как адаптировать LLM: от обучения инструкциям до RAG

MIT OpenCourseWare · 07.01

📝 Learning to summarize from human feedback (Paper Explained)

Yannic Kilcher · 07.09.20

⚡ Эра NVIDIA H100 и ИИ-агенты: главные тренды внедрения технологий

The Cognitive Revolution · 18.07.23

🧩 Архитектура Mixture-of-Experts и тренды масштабирования больших моделей от Ирвана Белло

The TWIML AI Podcast · 25.04.22

🧠 Как технология TAO от Databricks превращает обычные нейросети в экспертов без участия человека

Eye on AI · 12.06.25

🧠 Джейкоб Андреас: «Как современные языковые модели учатся рассуждать»

MIT OpenCourseWare · 11.02

🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»

Stanford Online · 14.11.25

🛠 Янник Килчер о ChatGPT: «Джейлбрейки в мире дистопии»

Yannic Kilcher · 07.12.22

🧬 Нейтан Ламберт о жизни после DPO: почему PPO все еще лучше, но сложнее

Stanford Online · 04.03.25

🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей

Andrej Karpathy · 05.02.25

🌐 Янник Кильхер: WebGPT, ожившие рисунки и новый журнал TMLR

Yannic Kilcher · 24.12.21

🔄 Подход Model-Based RL: как Стэнфорд обучает сложных роботов за четыре часа

Stanford Online · 08.12.25

🗣 Лора Руис о коммуникации ИИ: «Модели не способны общаться в режиме zero-shot»

Machine Learning Street Talk · 06.12.22

🐙 Кеннет Стенли: «RLHF — это наклеивание смайлика на хаос интернета»

Machine Learning Street Talk · 26.03.23

🔄 Янник Кильчер разобрал метод Reinforced Self-Training от Google DeepMind

Yannic Kilcher · 03.09.23

🤖 Арчит Шарма о будущем LLM: как обучают ChatGPT?

Stanford Online · 04.03.25

🚀 Преподаватель Стэнфорда о методах обучения языковых моделей: от RLHF к DPO

Stanford Online · 08.12.25

📊 Чип Хьюен: как создавать ИИ-продукты, которые действительно работают

Lenny's Podcast · 23.10.25

🏗 Раза Хабиб о внедрении AI: почему RLHF переоценен

The Cognitive Revolution · 27.04.23

🚀 GPT-5 и эра агентов: Кристина Ким о том, почему «данные — это новая таблетка»

a16z (Andreessen Horowitz) · 08.08.25

🕹 Google DeepMind: «SIMA 2 приближает нас к созданию AGI через видеоигры»

Wes Roth · 15.11.25

🔄 Как устроен посттренинг языковых моделей: от SFT до RLHF

Stanford Online · 20.06.25

🧠 Марк Чен и Якуб Пахоцкий раскрыли долгосрочную стратегию OpenAI

a16z (Andreessen Horowitz) · 25.09.25

🔬 Как Future House автоматизирует научные открытия с помощью ИИ-агентов

The Cognitive Revolution · 05.12.24

🧠 Эра Vibe Coding: как лидеры OpenAI Марк Чен и Якуб Пахоцкий меняют разработку ИИ

a16z · 25.09.25

🕰 Мин Дин об эволюции ИИ: от больших языковых к мультимодальным моделям

Stanford Online · 30.05.24

🚀 Как Anthropic защищает нейросети от государственного шпионажа

The Cognitive Revolution · 25.09.24

🚀 Мин Дин из Zhipu AI: от языковых моделей к мультимодальным системам будущего

Stanford Online · 30.05.24