Поиск

Найдено: 37

🚀 Эволюция Transformer: как ускорить инференс и снизить VRAM

freeCodeCamp.org · 26.06.25

🌅 За пределами внимания: почему архитектура Mamba станет преемником Transformer

The Cognitive Revolution · 22.12.23

🤖 Создание собственного Vision Transformer с нуля: руководство

freeCodeCamp.org · 25.02.25

🧠 Янник Килхер разобрал гипотезу трансформеров как универсальных вычислителей

Yannic Kilcher · 16.03.21

🧠 DeepSeek: Как китайский хедж-фонд взломал монополию Кремниевой долины

Lex Fridman · 03.02.25

🎥 Как трансформеры совершили революцию в видеогенерации: разбор архитектуры Movie Gen от Meta

Stanford Online · 03.07.25

📊 Как Андрей Карпатый собрал GPT из 200 строк кода

Andrej Karpathy · 17.01.23

🎓 Стэндфордский курс CME295: глубокое погружение в архитектуру Transformer

Stanford Online · 17.10.25

🧠 Как активные дендриты защищают нейросети от катастрофического забывания

Yannic Kilcher · 20.03.22

🌍 Как устроена архитектура Transformers и зачем ей скалярное произведение

MIT OpenCourseWare · 07.01

🧩 Как работают трансформеры: От self-attention до BERT и Hugging Face

MIT OpenCourseWare · 07.01

🧠 Linformer: как аппроксимация матриц низкого ранга ускоряет трансформеры

Yannic Kilcher · 11.06.20

🧠 От чатов WhatsApp до PyTorch: гайд по сборке нейросети

freeCodeCamp.org · 10.04.25

🧠 Разбор DeBERTa: как Microsoft улучшила архитектуру BERT

Yannic Kilcher · 25.02.21

⚙ Янник Килчер о LLaMA: «Инженерный триумф, ограниченный лицензией»

Yannic Kilcher · 02.03.23

🛠 «Они захватили всё»: Рама Рамакришнан о принципах работы трансформеров

MIT OpenCourseWare · 07.01

🕰 Эволюция нейросетей: от «Attention Is All You Need» до агентов L5

Stanford Online · 23.04.24

🚀 Иллюзия разума: математика и архитектура современных LLM

freeCodeCamp.org · 24.04.25

📈 Эра гибридных архитектур: сможет ли Mamba вытеснить Трансформеры?

The Cognitive Revolution · 30.03.24

🎓 Riiid Labs: как ИИ предсказывает результаты экзаменов за 10 минут с точностью 98%

Eye on AI · 03.02.21

🪄 Янник Кильхер: «SOTA — это магическое слово, заставляющее рецензентов нажимать Accept»

Yannic Kilcher · 24.12.20

Retentive Network: сможет ли линейная архитектура заменить Transformer?

Yannic Kilcher · 13.09.23

🛠 Зачем Стэнфорд убрал классические задачи ради PyTorch и Einops?

Stanford Online · 09.03

🧠 Стэнфордский курс CS236: разбор фундаментальных основ глубокого генеративного ИИ

Stanford Online · 06.05.24

🌐 Vision Transformer: полный цикл обучения нейросети на PyTorch

freeCodeCamp.org · 27.05.25

🛠 Как оптимизировать инференс языковых моделей: от архитектуры до vLLM

Stanford Online · 19.05.25

🧠 OpenAI vs. DeepSeek vs. Qwen: архитектурная битва LLM

Y Combinator · 29.08.25

🚀 AI Explained: «OpenAI — не бог, а лидерство Запада в ИИ стремительно тает»

AI Explained · 27.04.25

🧠 Смесь экспертов: почему архитектура MoE стала стандартом для современных ИИ

Stanford Online · 24.04.25

🚀 Технический разбор DeepSeek: почему китайская модель R1 стоит в разы дешевле аналогов

Y Combinator · 05.02.25