RDLY
.ru
Тренды
Статьи
Темы
Люди
f
freeCodeCamp.org
Образовательная платформа
2
статьи
116 тыс.
просмотров
2025–2026
период
1
канал
💬 Заметные цитаты
«The only thing that you need to change is this. When you create the key and query tensors from the input, you will rotate them before calculating the attention.»
→
Эволюция Transformer: как ускорить инференс и снизить VRAM
👥 Часто вместе с
Immad Sadi
1
Instructor
1
Kian
1
Speaker
1
Ведущий
1
📺 Где появляется
freeCodeCamp.org
2
🧠 Ключевые концепции
RoPE
1
MQA
1
MLA
1
Конвейерный параллелизм
1
1F1B (One Forward, One Backward)
1
Пузырь простоя (Bubble)
1
Микробатч
1
📈 Темы
Глубокое обучение
1
Transformer
1
PyTorch
1
Multi-Query Attention
1
конвейерный параллелизм
1
алгоритм 1F1B
1
Инференс
1
RoPE
1
GPU
1
оптимизация памяти
1
📺 Материалы с участием
3ч 22м
🚀 Как приручить GPU: руководство по конвейерному параллелизму
freeCodeCamp.org · 26.01 · 34,6 тыс. просм.
2ч 49м
🚀 Эволюция Transformer: как ускорить инференс и снизить VRAM
freeCodeCamp.org · 26.06.25 · 81,1 тыс. просм.