RDLY
.ru
Тренды
Статьи
Темы
Люди
Поиск
Найти
Найдено: 37
2ч 49м
🚀 Эволюция Transformer: как ускорить инференс и снизить VRAM
freeCodeCamp.org · 26.06.25
2ч 30м
🌅 За пределами внимания: почему архитектура Mamba станет преемником Transformer
The Cognitive Revolution · 22.12.23
59 мин
🤖 Создание собственного Vision Transformer с нуля: руководство
freeCodeCamp.org · 25.02.25
34 мин
🧠 Янник Килхер разобрал гипотезу трансформеров как универсальных вычислителей
Yannic Kilcher · 16.03.21
5ч 06м
🧠 DeepSeek: Как китайский хедж-фонд взломал монополию Кремниевой долины
Lex Fridman · 03.02.25
1ч 13м
🎥 Как трансформеры совершили революцию в видеогенерации: разбор архитектуры Movie Gen от Meta
Stanford Online · 03.07.25
1ч 56м
📊 Как Андрей Карпатый собрал GPT из 200 строк кода
Andrej Karpathy · 17.01.23
1ч 41м
🎓 Стэндфордский курс CME295: глубокое погружение в архитектуру Transformer
Stanford Online · 17.10.25
56 мин
🧠 Как активные дендриты защищают нейросети от катастрофического забывания
Yannic Kilcher · 20.03.22
1ч 16м
🌍 Как устроена архитектура Transformers и зачем ей скалярное произведение
MIT OpenCourseWare · 07.01
1ч 16м
🧩 Как работают трансформеры: От self-attention до BERT и Hugging Face
MIT OpenCourseWare · 07.01
50 мин
🧠 Linformer: как аппроксимация матриц низкого ранга ускоряет трансформеры
Yannic Kilcher · 11.06.20
3ч 29м
🧠 От чатов WhatsApp до PyTorch: гайд по сборке нейросети
freeCodeCamp.org · 10.04.25
45 мин
🧠 Разбор DeBERTa: как Microsoft улучшила архитектуру BERT
Yannic Kilcher · 25.02.21
41 мин
⚙ Янник Килчер о LLaMA: «Инженерный триумф, ограниченный лицензией»
Yannic Kilcher · 02.03.23
1ч 16м
🛠 «Они захватили всё»: Рама Рамакришнан о принципах работы трансформеров
MIT OpenCourseWare · 07.01
1ч 17м
🕰 Эволюция нейросетей: от «Attention Is All You Need» до агентов L5
Stanford Online · 23.04.24
3ч 28м
🚀 Иллюзия разума: математика и архитектура современных LLM
freeCodeCamp.org · 24.04.25
1ч 16м
📈 Эра гибридных архитектур: сможет ли Mamba вытеснить Трансформеры?
The Cognitive Revolution · 30.03.24
44 мин
🎓 Riiid Labs: как ИИ предсказывает результаты экзаменов за 10 минут с точностью 98%
Eye on AI · 03.02.21
14 мин
🪄 Янник Кильхер: «SOTA — это магическое слово, заставляющее рецензентов нажимать Accept»
Yannic Kilcher · 24.12.20
28 мин
Retentive Network: сможет ли линейная архитектура заменить Transformer?
Yannic Kilcher · 13.09.23
1ч 06м
🛠 Зачем Стэнфорд убрал классические задачи ради PyTorch и Einops?
Stanford Online · 09.03
57 мин
🧠 Стэнфордский курс CS236: разбор фундаментальных основ глубокого генеративного ИИ
Stanford Online · 06.05.24
2ч 04м
🌐 Vision Transformer: полный цикл обучения нейросети на PyTorch
freeCodeCamp.org · 27.05.25
1ч 22м
🛠 Как оптимизировать инференс языковых моделей: от архитектуры до vLLM
Stanford Online · 19.05.25
12 мин
🧠 OpenAI vs. DeepSeek vs. Qwen: архитектурная битва LLM
Y Combinator · 29.08.25
34 мин
🚀 AI Explained: «OpenAI — не бог, а лидерство Запада в ИИ стремительно тает»
AI Explained · 27.04.25
1ч 21м
🧠 Смесь экспертов: почему архитектура MoE стала стандартом для современных ИИ
Stanford Online · 24.04.25
13 мин
🚀 Технический разбор DeepSeek: почему китайская модель R1 стоит в разы дешевле аналогов
Y Combinator · 05.02.25
27 мин
🧠 a16z: Как DeepSeek R1 обрушил стоимость обучения ИИ и открыл новую эру рассуждающих моделей
a16z (Andreessen Horowitz) · 05.03.25
4ч 25м
🌐 Китай против США: как ИИ изменил мир к 2026 году
Lex Fridman · 31.01
1ч 04м
🏗 Разреженная смесь экспертов: детальный разбор архитектуры Mixtral 8x7B
Stanford Online · 16.05.24
1ч 06м
🔄 Стэнфордский курс CS231N: эволюция механизма внимания и архитектуры трансформеров
Stanford Online · 02.09.25
1ч 14м
💍 Филипп Изола: «Трансформер — это кольцо всевластия в современном ИИ»
MIT OpenCourseWare · 11.02
1ч 28м
📰 Кэл Ньюпорт: «ChatGPT — не разум, а угадывание слов»
Deep Questions with Cal Newport · 17.04.23
34 мин
🧠 Языковые модели как универсальные вычислители: разбор исследования от Янника Кильчера
Yannic Kilcher · 16.03.21