self-attention

15 статей

💍 Филипп Изола: «Трансформер — это кольцо всевластия в современном ИИ»

MIT OpenCourseWare · 11.02 · 4,6 тыс. просм.

🧩 Как работают трансформеры: От self-attention до BERT и Hugging Face

MIT OpenCourseWare · 07.01 · 11,6 тыс. просм.

🌍 Как устроена архитектура Transformers и зачем ей скалярное произведение

MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.

🛠 «Они захватили всё»: Рама Рамакришнан о принципах работы трансформеров

MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.

🎓 Стэндфордский курс CME295: глубокое погружение в архитектуру Transformer

Stanford Online · 17.10.25 · 704 тыс. просм.

🤖 „Мы рассматриваем роботов как токены“: новая архитектура управления роем

Stanford Online · 26.06.25 · 4,1 тыс. просм.

🚀 Иллюзия разума: математика и архитектура современных LLM

freeCodeCamp.org · 24.04.25 · 87,2 тыс. просм.

👓 Почему нейросети «близоруки»: Федерико Барберо о фундаментальных изъянах внимания

Machine Learning Street Talk · 08.03.25 · 19,8 тыс. просм.

📊 Как Андрей Карпатый собрал GPT из 200 строк кода

Andrej Karpathy · 17.01.23 · 7,1 млн просм.

🛑 Как Nyströmformer решает проблему квадратичной сложности в архитектуре Transformer

Yannic Kilcher · 11.02.21 · 17,6 тыс. просм.

🧠 Линейное внимание вместо квадратичного: спасёт ли метод Найстрема современные нейросети?

Yannic Kilcher · 11.02.21 · 17,6 тыс. просм.

🏗 Как Feedback Transformer решает проблему многошаговых рассуждений в ИИ?

Yannic Kilcher · 02.02.21 · 16 тыс. просм.

🚀 Быстрее EfficientNet в 4.5 раза: Янник Килчер объясняет устройство LambdaLayers

Yannic Kilcher · 17.10.20 · 48,9 тыс. просм.

🧠 Linformer: как аппроксимация матриц низкого ранга ускоряет трансформеры

Yannic Kilcher · 11.06.20 · 35,2 тыс. просм.

Янник Кильхер о Synthesizer: переосмысление внимания в Transformer

Yannic Kilcher · 31.05.20 · 17,2 тыс. просм.