RDLY
.ru
Тренды
Статьи
Темы
Люди
self-attention
15 статей
1ч 14м
💍 Филипп Изола: «Трансформер — это кольцо всевластия в современном ИИ»
MIT OpenCourseWare · 11.02 · 4,6 тыс. просм.
1ч 16м
🧩 Как работают трансформеры: От self-attention до BERT и Hugging Face
MIT OpenCourseWare · 07.01 · 11,6 тыс. просм.
1ч 16м
🌍 Как устроена архитектура Transformers и зачем ей скалярное произведение
MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.
1ч 16м
🛠 «Они захватили всё»: Рама Рамакришнан о принципах работы трансформеров
MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.
1ч 41м
🎓 Стэндфордский курс CME295: глубокое погружение в архитектуру Transformer
Stanford Online · 17.10.25 · 704 тыс. просм.
53 мин
🤖 „Мы рассматриваем роботов как токены“: новая архитектура управления роем
Stanford Online · 26.06.25 · 4,1 тыс. просм.
3ч 28м
🚀 Иллюзия разума: математика и архитектура современных LLM
freeCodeCamp.org · 24.04.25 · 87,2 тыс. просм.
1ч
👓 Почему нейросети «близоруки»: Федерико Барберо о фундаментальных изъянах внимания
Machine Learning Street Talk · 08.03.25 · 19,8 тыс. просм.
1ч 56м
📊 Как Андрей Карпатый собрал GPT из 200 строк кода
Andrej Karpathy · 17.01.23 · 7,1 млн просм.
48 мин
🛑 Как Nyströmformer решает проблему квадратичной сложности в архитектуре Transformer
Yannic Kilcher · 11.02.21 · 17,6 тыс. просм.
48 мин
🧠 Линейное внимание вместо квадратичного: спасёт ли метод Найстрема современные нейросети?
Yannic Kilcher · 11.02.21 · 17,6 тыс. просм.
43 мин
🏗 Как Feedback Transformer решает проблему многошаговых рассуждений в ИИ?
Yannic Kilcher · 02.02.21 · 16 тыс. просм.
59 мин
🚀 Быстрее EfficientNet в 4.5 раза: Янник Килчер объясняет устройство LambdaLayers
Yannic Kilcher · 17.10.20 · 48,9 тыс. просм.
50 мин
🧠 Linformer: как аппроксимация матриц низкого ранга ускоряет трансформеры
Yannic Kilcher · 11.06.20 · 35,2 тыс. просм.
48 мин
Янник Кильхер о Synthesizer: переосмысление внимания в Transformer
Yannic Kilcher · 31.05.20 · 17,2 тыс. просм.