RDLY
.ru
Тренды
Статьи
Темы
Трансформер
76 статей
1ч 19м
🤖 Как устроены современные языковые модели: от обучения до системных ограничений
Stanford Online · 09.03
38 мин
📉 Филип Изола: «Простые алгоритмы побеждают благодаря масштабированию»
MIT OpenCourseWare · 11.02
1ч 16м
🧩 Как работают трансформеры: От self-attention до BERT и Hugging Face
MIT OpenCourseWare · 07.01
56 мин
📉 Джейкоб из Manifest AI: «Будущее ИИ — это не трансформеры, а Power Retention»
Eye on AI · 09.11.25
1ч 47м
🧭 От BERT до RoPE: Шервин и Афшин об эволюции архитектуры Transformer
Stanford Online · 17.10.25
1ч 41м
🎓 Стэндфордский курс CME295: глубокое погружение в архитектуру Transformer
Stanford Online · 17.10.25
1ч
🏫 Эндрю Ын: «Совет не учиться программированию — это худший карьерный совет в истории»
Stanford Online · 01.10.25
2ч 49м
🚀 Эволюция Transformer: как ускорить инференс и снизить VRAM
freeCodeCamp.org · 26.06.25
58 мин
Генеративный ИИ в медицине: как работают большие языковые модели
Stanford Online · 30.04.25
1ч 18м
🏗 Стэнфорд запустил курс CS336 по созданию LLM: от байтовых токенов до GPU-ядер
Stanford Online · 24.04.25
1ч 21м
🧠 Смесь экспертов: почему архитектура MoE стала стандартом для современных ИИ
Stanford Online · 24.04.25
59 мин
🧠 Педро Домингос: «Современный успех ИИ — это локальный оптимум, а не финал»
Eye on AI · 17.04.25
1ч 26м
Стэнфорд о создании LLM: «Архитектура и гиперпараметры»
Stanford Online · 16.04.25
1ч 26м
🏗 Как обучают современные модели: архитектурный консенсус
Stanford Online · 16.04.25
52 мин
🧠 От Трансформеров к Jamba: Шохам о будущем корпоративного ИИ и Maestro
Eye on AI · 27.03.25
14 мин
🕹 Microsoft Muse: как генеративный ИИ создает геймплей без программного кода
Wes Roth · 25.02.25
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
15 мин
🧠 Google: «Архитектура Titans копирует человеческую память для прорыва в ИИ»
Wes Roth · 16.01.25
1ч 12м
💥 Юрген Шмидхубер о краже идей, природе сознания и колонизации космоса
Machine Learning Street Talk · 16.01.25
33 мин
🧠 Экзокортекс в облаке: Андрей Карпати о будущем ИИ
Wes Roth · 09.09.24
36 мин
🚗 Как Waymo обучает беспилотные автомобили с помощью генеративного ИИ
a16z (Andreessen Horowitz) · 05.08.24
36 мин
⚖ Хён Вон Чун о будущем ИИ: «Масштабирование важнее структуры»
Stanford Online · 11.06.24
36 мин
📉 Хён Вон Чон: «Масштабирование — главный драйвер будущего ИИ»
Stanford Online · 11.06.24
1ч 19м
🧠 Как обучить нейросеть за 20 минут без GPU?
Stanford Online · 23.05.24
1ч 23м
🧠 Авторегрессионные модели: от рекуррентных сетей к трансформерам и MLE
Stanford Online · 06.05.24
1ч 17м
🧠 OpenAI в Стэнфорде: почему масштаб важнее архитектуры и как работает «магия» LLM
Stanford Online · 06.05.24
1ч 19м
🔬 Внутри черного ящика ИИ: как методы Bow Lab раскрывают мышление нейросетей
The Cognitive Revolution · 05.04.24
1ч 20м
🧬 Натан Ламберт о Mamba: «Это начало эпохи бесконечного контекста»
The Cognitive Revolution · 30.03.24
42 мин
🚀 Как превратить нейросеть в читаемую программу: метод Дэна Фридмана
The TWIML AI Podcast · 15.01.24
59 мин
🤖 Майк Вулдридж: «Языковые модели не понимают смысла создаваемых фраз»
The Royal Institution · 05.01.24
52 мин
🚀 Маркус Нагель из Qualcomm о квантовании трансформеров и оптимизации ИИ для мобильных устройств
The TWIML AI Podcast · 26.12.23
2ч 30м
🌅 За пределами внимания: почему архитектура Mamba станет преемником Transformer
The Cognitive Revolution · 22.12.23
1ч
🕰 Майкл Вулдридж: «Нейросети — это прославленный автозаполнитель, а не разум»
The Royal Institution · 19.12.23
59 мин
📦 Андрей Карпатый: LLM — это ядро новой операционной системы
Andrej Karpathy · 23.11.23
1ч 03м
🧠 Трей Коллмер о будущем Transformer: токены пауз, аналогический промптинг и Ring Attention
The Cognitive Revolution · 20.10.23
1ч 10м
🧠 Джефф Бек: «Байесовский мозг эффективнее градиентного спуска»
Machine Learning Street Talk · 13.10.23
28 мин
Retentive Network: сможет ли линейная архитектура заменить Transformer?
Yannic Kilcher · 13.09.23
1ч 05м
🔄 Роланд Мемошевич: «Будущее ИИ требует возвращения рекурсии и физического заземления»
The TWIML AI Podcast · 11.09.23
1ч 33м
🚀 Нейтан Лабенц об основах обучения нейросетей и феномене гроккинга
The Cognitive Revolution · 06.07.23
1ч 02м
🏗 Янник Кильхер о модели RWKV: «Это, по сути, большая конволюционная сеть»
Yannic Kilcher · 02.06.23
1ч 01м
🏗 Эйдан Гомес о будущем ИИ: «Мы стоим на пороге трансформации продуктов»
Eye on AI · 24.05.23
24 мин
🧐 Как архитектура RMT масштабирует контекст Transformer до миллиона токенов
Yannic Kilcher · 27.04.23
51 мин
🧠 Кэл Ньюпорт: „ChatGPT — это не инопланетный разум“
Deep Questions with Cal Newport · 22.04.23
41 мин
⚙ Янник Килчер о LLaMA: «Инженерный триумф, ограниченный лицензией»
Yannic Kilcher · 02.03.23
1ч 56м
📊 Как Андрей Карпатый собрал GPT из 200 строк кода
Andrej Karpathy · 17.01.23
51 мин
🚀 Эйдан Гомес (Cohere): языковые модели как новое программное обеспечение
Machine Learning Street Talk · 14.11.22
3ч 28м
🧠 Андрей Карпатый: ИИ как инопланетный артефакт и конец биологии
Lex Fridman · 29.10.22
32 мин
⛏ Как нейросеть OpenAI научилась крафтить алмазную кирку в Minecraft
Yannic Kilcher · 26.06.22
50 мин
🧠 Ориол Виньялс: «Мы строим инструментарий для будущего ИИ»
Eye on AI · 12.05.22
51 мин
🔍 Янник Кильхер о DSI: как нейросети запоминают документы
Yannic Kilcher · 16.04.22
45 мин
🧠 AlphaCode: как ИИ решает задачи уровня олимпиад
Yannic Kilcher · 01.03.22
1ч 11м
🧩 Стефан Дасколи: «Символьная регрессия откроет роботам законы физики»
Yannic Kilcher · 29.01.22
31 мин
🧠 Янник Килчер о методе ALiBi: «Трансформеры теперь могут работать с текстами в 10 раз длиннее»
Yannic Kilcher · 02.09.21
35 мин
📉 Янник Кильхер проанализировал линейную архитектуру Fastformer
Yannic Kilcher · 26.08.21
41 мин
Янник Кильхер: «Expire-Span учит нейросети правильно забывать»
Yannic Kilcher · 24.05.21
34 мин
📉 FNet: как Google ускоряет sequence-модели без блоков внимания
Yannic Kilcher · 21.05.21
1ч 40м
📉 Марк Саруфим и Мэтью Салварис обсудили кризис стимулов в ИИ
Machine Learning Street Talk · 06.03.21
48 мин
🛑 Как Nyströmformer решает проблему квадратичной сложности в архитектуре Transformer
Yannic Kilcher · 11.02.21
1ч 58м
🧭 Лена Войта об информационном горлышке и ловушках зондирования трансформеров
Machine Learning Street Talk · 23.01.21
40 мин
💡 Куок Ле о создании нейросетей и будущем NLP: от кота в Google до генеративных моделей
DeepLearning.AI · 13.10.20
1ч 13м
⚙ Янник Килчер: „GShard — это инженерный прорыв в масштабировании моделей“
Yannic Kilcher · 01.07.20
31 мин
🖼 Янник Кильхер о модели Image GPT от OpenAI: «Генеративное обучение на пикселях»
Yannic Kilcher · 18.06.20
36 мин
🧮 Янник Кильчер: «Языковые модели находят „костыли“ для решения задач высшей математики»
Yannic Kilcher · 13.06.20
50 мин
🧠 Linformer: как аппроксимация матриц низкого ранга ускоряет трансформеры
Yannic Kilcher · 11.06.20
48 мин
🧠 Нужен ли трансформерам Self-Attention? Мнение блогера Янника Кильхера
Yannic Kilcher · 31.05.20
48 мин
Янник Кильхер о Synthesizer: переосмысление внимания в Transformer
Yannic Kilcher · 31.05.20
31 мин
🧠 TAPAS: как нейросети учатся «читать» таблицы без SQL
Yannic Kilcher · 05.05.20
11 мин
🛠 Янник Килчер: «Blender — это инженерное руководство, а не научный прорыв»
Yannic Kilcher · 03.05.20
1ч 40м
🛠 Google T5: новые горизонты обучения нейросетей
Machine Learning Street Talk · 24.04.20
26 мин
Longformer: как эффективно анализировать длинные документы
Yannic Kilcher · 20.04.20
18 мин
🧱 Янник Килчер об Imputer: баланс скорости и точности в распознавании речи
Yannic Kilcher · 14.04.20
24 мин
🧠 Deep Learning в символьной математике: как Facebook AI обошли Mathematica
Yannic Kilcher · 24.02.20
29 мин
🧠 Как уместить 64 000 токенов в одну видеокарту: разбор нейросети Reformer
Yannic Kilcher · 22.01.20
23 мин
🕒 Как параллельное декодирование ускоряет авторегрессионные модели в 7 раз
Yannic Kilcher · 06.05.19
27 мин
🧠 Янник Килчер о GPT-2: «Модель учится задачам без обучения»
Yannic Kilcher · 18.02.19
27 мин
Янник Килхер о «Attention Is All You Need»: революция в NLP
Yannic Kilcher · 28.11.17