Трансформер

76 статей

1ч 19м
🤖 Как устроены современные языковые модели: от обучения до системных ограничений
Stanford Online · 09.03
38 мин
📉 Филип Изола: «Простые алгоритмы побеждают благодаря масштабированию»
MIT OpenCourseWare · 11.02
1ч 16м
🧩 Как работают трансформеры: От self-attention до BERT и Hugging Face
MIT OpenCourseWare · 07.01
56 мин
📉 Джейкоб из Manifest AI: «Будущее ИИ — это не трансформеры, а Power Retention»
Eye on AI · 09.11.25
1ч 47м
🧭 От BERT до RoPE: Шервин и Афшин об эволюции архитектуры Transformer
Stanford Online · 17.10.25
1ч 41м
🎓 Стэндфордский курс CME295: глубокое погружение в архитектуру Transformer
Stanford Online · 17.10.25
🏫 Эндрю Ын: «Совет не учиться программированию — это худший карьерный совет в истории»
Stanford Online · 01.10.25
2ч 49м
🚀 Эволюция Transformer: как ускорить инференс и снизить VRAM
freeCodeCamp.org · 26.06.25
58 мин
Генеративный ИИ в медицине: как работают большие языковые модели
Stanford Online · 30.04.25
1ч 18м
🏗 Стэнфорд запустил курс CS336 по созданию LLM: от байтовых токенов до GPU-ядер
Stanford Online · 24.04.25
1ч 21м
🧠 Смесь экспертов: почему архитектура MoE стала стандартом для современных ИИ
Stanford Online · 24.04.25
59 мин
🧠 Педро Домингос: «Современный успех ИИ — это локальный оптимум, а не финал»
Eye on AI · 17.04.25
1ч 26м
Стэнфорд о создании LLM: «Архитектура и гиперпараметры»
Stanford Online · 16.04.25
1ч 26м
🏗 Как обучают современные модели: архитектурный консенсус
Stanford Online · 16.04.25
52 мин
🧠 От Трансформеров к Jamba: Шохам о будущем корпоративного ИИ и Maestro
Eye on AI · 27.03.25
14 мин
🕹 Microsoft Muse: как генеративный ИИ создает геймплей без программного кода
Wes Roth · 25.02.25
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
15 мин
🧠 Google: «Архитектура Titans копирует человеческую память для прорыва в ИИ»
Wes Roth · 16.01.25
1ч 12м
💥 Юрген Шмидхубер о краже идей, природе сознания и колонизации космоса
Machine Learning Street Talk · 16.01.25
33 мин
🧠 Экзокортекс в облаке: Андрей Карпати о будущем ИИ
Wes Roth · 09.09.24
36 мин
🚗 Как Waymo обучает беспилотные автомобили с помощью генеративного ИИ
a16z (Andreessen Horowitz) · 05.08.24
36 мин
⚖ Хён Вон Чун о будущем ИИ: «Масштабирование важнее структуры»
Stanford Online · 11.06.24
36 мин
📉 Хён Вон Чон: «Масштабирование — главный драйвер будущего ИИ»
Stanford Online · 11.06.24
1ч 19м
🧠 Как обучить нейросеть за 20 минут без GPU?
Stanford Online · 23.05.24
1ч 23м
🧠 Авторегрессионные модели: от рекуррентных сетей к трансформерам и MLE
Stanford Online · 06.05.24
1ч 17м
🧠 OpenAI в Стэнфорде: почему масштаб важнее архитектуры и как работает «магия» LLM
Stanford Online · 06.05.24
1ч 19м
🔬 Внутри черного ящика ИИ: как методы Bow Lab раскрывают мышление нейросетей
The Cognitive Revolution · 05.04.24
1ч 20м
🧬 Натан Ламберт о Mamba: «Это начало эпохи бесконечного контекста»
The Cognitive Revolution · 30.03.24
42 мин
🚀 Как превратить нейросеть в читаемую программу: метод Дэна Фридмана
The TWIML AI Podcast · 15.01.24
59 мин
🤖 Майк Вулдридж: «Языковые модели не понимают смысла создаваемых фраз»
The Royal Institution · 05.01.24