RDLY
.ru
Тренды
Статьи
Темы
Люди
I
Immad Sadi
Эксперт в области архитектуры ИИ
1
статья
81 тыс.
просмотров
2025
период
1
канал
💬 Заметные цитаты
«Previously, the 2017 model was using roughly 7 GB of VRAM while training. But now, thanks to multi head latent attention, the model uses only 3.5 GB of VRAM.»
→
Эволюция Transformer: как ускорить инференс и снизить VRAM
👥 Часто вместе с
freeCodeCamp.org
1
📺 Где появляется
freeCodeCamp.org
1
🧠 Ключевые концепции
RoPE
1
MQA
1
MLA
1
📈 Темы
Multi-Query Attention
1
Глубокое обучение
1
Transformer
1
Инференс
1
RoPE
1
📺 Материалы с участием
2ч 49м
🚀 Эволюция Transformer: как ускорить инференс и снизить VRAM
freeCodeCamp.org · 26.06.25 · 81,1 тыс. просм.