I

Immad Sadi

Эксперт в области архитектуры ИИ

1статья
81 тыс.просмотров
2025период
1канал

💬 Заметные цитаты

«Previously, the 2017 model was using roughly 7 GB of VRAM while training. But now, thanks to multi head latent attention, the model uses only 3.5 GB of VRAM.»

👥 Часто вместе с

📺 Где появляется

🧠 Ключевые концепции

📈 Темы Multi-Query Attention1Глубокое обучение1Transformer1Инференс1RoPE1

📺 Материалы с участием