RDLY
.ru
Тренды
Статьи
Темы
Люди
Трансформер
76 статей
1ч 19м
🤖 Как устроены современные языковые модели: от обучения до системных ограничений
Stanford Online · 09.03 · 4,1 тыс. просм.
38 мин
📉 Филип Изола: «Простые алгоритмы побеждают благодаря масштабированию»
MIT OpenCourseWare · 11.02 · 1,3 тыс. просм.
1ч 16м
🧩 Как работают трансформеры: От self-attention до BERT и Hugging Face
MIT OpenCourseWare · 07.01 · 11,6 тыс. просм.
56 мин
📉 Джейкоб из Manifest AI: «Будущее ИИ — это не трансформеры, а Power Retention»
Eye on AI · 09.11.25 · 3,2 тыс. просм.
1ч 47м
🧭 От BERT до RoPE: Шервин и Афшин об эволюции архитектуры Transformer
Stanford Online · 17.10.25 · 137 тыс. просм.
1ч 41м
🎓 Стэндфордский курс CME295: глубокое погружение в архитектуру Transformer
Stanford Online · 17.10.25 · 704 тыс. просм.
1ч
🏫 Эндрю Ын: «Совет не учиться программированию — это худший карьерный совет в истории»
Stanford Online · 01.10.25 · 587 тыс. просм.
2ч 49м
🚀 Эволюция Transformer: как ускорить инференс и снизить VRAM
freeCodeCamp.org · 26.06.25 · 81,1 тыс. просм.
58 мин
Генеративный ИИ в медицине: как работают большие языковые модели
Stanford Online · 30.04.25 · 39,9 тыс. просм.
1ч 18м
🏗 Стэнфорд запустил курс CS336 по созданию LLM: от байтовых токенов до GPU-ядер
Stanford Online · 24.04.25 · 617 тыс. просм.
1ч 21м
🧠 Смесь экспертов: почему архитектура MoE стала стандартом для современных ИИ
Stanford Online · 24.04.25 · 73,5 тыс. просм.
59 мин
🧠 Педро Домингос: «Современный успех ИИ — это локальный оптимум, а не финал»
Eye on AI · 17.04.25 · 1,1 тыс. просм.
1ч 26м
Стэнфорд о создании LLM: «Архитектура и гиперпараметры»
Stanford Online · 16.04.25 · 100 тыс. просм.
1ч 26м
🏗 Как обучают современные модели: архитектурный консенсус
Stanford Online · 16.04.25 · 100 тыс. просм.
52 мин
🧠 От Трансформеров к Jamba: Шохам о будущем корпоративного ИИ и Maestro
Eye on AI · 27.03.25 · 537 просм.
14 мин
🕹 Microsoft Muse: как генеративный ИИ создает геймплей без программного кода
Wes Roth · 25.02.25 · 28,7 тыс. просм.
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25 · 6,2 млн просм.
15 мин
🧠 Google: «Архитектура Titans копирует человеческую память для прорыва в ИИ»
Wes Roth · 16.01.25 · 46,8 тыс. просм.
1ч 12м
💥 Юрген Шмидхубер о краже идей, природе сознания и колонизации космоса
Machine Learning Street Talk · 16.01.25 · 24,5 тыс. просм.
33 мин
🧠 Экзокортекс в облаке: Андрей Карпати о будущем ИИ
Wes Roth · 09.09.24 · 48,5 тыс. просм.
36 мин
🚗 Как Waymo обучает беспилотные автомобили с помощью генеративного ИИ
a16z (Andreessen Horowitz) · 05.08.24 · 5,6 тыс. просм.
36 мин
⚖ Хён Вон Чун о будущем ИИ: «Масштабирование важнее структуры»
Stanford Online · 11.06.24 · 210 тыс. просм.
36 мин
📉 Хён Вон Чон: «Масштабирование — главный драйвер будущего ИИ»
Stanford Online · 11.06.24 · 210 тыс. просм.
1ч 19м
🧠 Как обучить нейросеть за 20 минут без GPU?
Stanford Online · 23.05.24 · 15,6 тыс. просм.
1ч 23м
🧠 Авторегрессионные модели: от рекуррентных сетей к трансформерам и MLE
Stanford Online · 06.05.24 · 32,3 тыс. просм.
1ч 17м
🧠 OpenAI в Стэнфорде: почему масштаб важнее архитектуры и как работает «магия» LLM
Stanford Online · 06.05.24 · 200 тыс. просм.
1ч 19м
🔬 Внутри черного ящика ИИ: как методы Bow Lab раскрывают мышление нейросетей
The Cognitive Revolution · 05.04.24 · 1,7 тыс. просм.
1ч 20м
🧬 Натан Ламберт о Mamba: «Это начало эпохи бесконечного контекста»
The Cognitive Revolution · 30.03.24 · 1 тыс. просм.
42 мин
🚀 Как превратить нейросеть в читаемую программу: метод Дэна Фридмана
The TWIML AI Podcast · 15.01.24 · 848 просм.
59 мин
🤖 Майк Вулдридж: «Языковые модели не понимают смысла создаваемых фраз»
The Royal Institution · 05.01.24 · 51,9 тыс. просм.
52 мин
🚀 Маркус Нагель из Qualcomm о квантовании трансформеров и оптимизации ИИ для мобильных устройств
The TWIML AI Podcast · 26.12.23 · 864 просм.
2ч 30м
🌅 За пределами внимания: почему архитектура Mamba станет преемником Transformer
The Cognitive Revolution · 22.12.23 · 9,7 тыс. просм.
1ч
🕰 Майкл Вулдридж: «Нейросети — это прославленный автозаполнитель, а не разум»
The Royal Institution · 19.12.23 · 577 тыс. просм.
59 мин
📦 Андрей Карпатый: LLM — это ядро новой операционной системы
Andrej Karpathy · 23.11.23 · 3,6 млн просм.
1ч 03м
🧠 Трей Коллмер о будущем Transformer: токены пауз, аналогический промптинг и Ring Attention
The Cognitive Revolution · 20.10.23 · 541 просм.
1ч 10м
🧠 Джефф Бек: «Байесовский мозг эффективнее градиентного спуска»
Machine Learning Street Talk · 13.10.23 · 25,9 тыс. просм.
28 мин
Retentive Network: сможет ли линейная архитектура заменить Transformer?
Yannic Kilcher · 13.09.23 · 103 тыс. просм.
1ч 05м
🔄 Роланд Мемошевич: «Будущее ИИ требует возвращения рекурсии и физического заземления»
The TWIML AI Podcast · 11.09.23 · 1,4 тыс. просм.
1ч 33м
🚀 Нейтан Лабенц об основах обучения нейросетей и феномене гроккинга
The Cognitive Revolution · 06.07.23 · 4,7 тыс. просм.
1ч 02м
🏗 Янник Кильхер о модели RWKV: «Это, по сути, большая конволюционная сеть»
Yannic Kilcher · 02.06.23 · 81,5 тыс. просм.
1ч 01м
🏗 Эйдан Гомес о будущем ИИ: «Мы стоим на пороге трансформации продуктов»
Eye on AI · 24.05.23 · 27 тыс. просм.
24 мин
🧐 Как архитектура RMT масштабирует контекст Transformer до миллиона токенов
Yannic Kilcher · 27.04.23 · 59,6 тыс. просм.
51 мин
🧠 Кэл Ньюпорт: „ChatGPT — это не инопланетный разум“
Deep Questions with Cal Newport · 22.04.23 · 8,1 тыс. просм.
41 мин
⚙ Янник Килчер о LLaMA: «Инженерный триумф, ограниченный лицензией»
Yannic Kilcher · 02.03.23 · 92,7 тыс. просм.
1ч 56м
📊 Как Андрей Карпатый собрал GPT из 200 строк кода
Andrej Karpathy · 17.01.23 · 7,1 млн просм.
51 мин
🚀 Эйдан Гомес (Cohere): языковые модели как новое программное обеспечение
Machine Learning Street Talk · 14.11.22 · 21,5 тыс. просм.
3ч 28м
🧠 Андрей Карпатый: ИИ как инопланетный артефакт и конец биологии
Lex Fridman · 29.10.22 · 3,9 млн просм.
32 мин
⛏ Как нейросеть OpenAI научилась крафтить алмазную кирку в Minecraft
Yannic Kilcher · 26.06.22 · 41,1 тыс. просм.
50 мин
🧠 Ориол Виньялс: «Мы строим инструментарий для будущего ИИ»
Eye on AI · 12.05.22 · 2,7 тыс. просм.
51 мин
🔍 Янник Кильхер о DSI: как нейросети запоминают документы
Yannic Kilcher · 16.04.22 · 25,7 тыс. просм.
45 мин
🧠 AlphaCode: как ИИ решает задачи уровня олимпиад
Yannic Kilcher · 01.03.22 · 11,8 тыс. просм.
1ч 11м
🧩 Стефан Дасколи: «Символьная регрессия откроет роботам законы физики»
Yannic Kilcher · 29.01.22 · 20,3 тыс. просм.
31 мин
🧠 Янник Килчер о методе ALiBi: «Трансформеры теперь могут работать с текстами в 10 раз длиннее»
Yannic Kilcher · 02.09.21 · 22,3 тыс. просм.
35 мин
📉 Янник Кильхер проанализировал линейную архитектуру Fastformer
Yannic Kilcher · 26.08.21 · 28,4 тыс. просм.
41 мин
Янник Кильхер: «Expire-Span учит нейросети правильно забывать»
Yannic Kilcher · 24.05.21 · 10,7 тыс. просм.
34 мин
📉 FNet: как Google ускоряет sequence-модели без блоков внимания
Yannic Kilcher · 21.05.21 · 30 тыс. просм.
1ч 40м
📉 Марк Саруфим и Мэтью Салварис обсудили кризис стимулов в ИИ
Machine Learning Street Talk · 06.03.21 · 18,6 тыс. просм.
48 мин
🛑 Как Nyströmformer решает проблему квадратичной сложности в архитектуре Transformer
Yannic Kilcher · 11.02.21 · 17,6 тыс. просм.
1ч 58м
🧭 Лена Войта об информационном горлышке и ловушках зондирования трансформеров
Machine Learning Street Talk · 23.01.21 · 11,7 тыс. просм.
40 мин
💡 Куок Ле о создании нейросетей и будущем NLP: от кота в Google до генеративных моделей
DeepLearning.AI · 13.10.20 · 8,3 тыс. просм.
1ч 13м
⚙ Янник Килчер: „GShard — это инженерный прорыв в масштабировании моделей“
Yannic Kilcher · 01.07.20 · 17,6 тыс. просм.
31 мин
🖼 Янник Кильхер о модели Image GPT от OpenAI: «Генеративное обучение на пикселях»
Yannic Kilcher · 18.06.20 · 30,7 тыс. просм.
36 мин
🧮 Янник Кильчер: «Языковые модели находят „костыли“ для решения задач высшей математики»
Yannic Kilcher · 13.06.20 · 7,2 тыс. просм.
50 мин
🧠 Linformer: как аппроксимация матриц низкого ранга ускоряет трансформеры
Yannic Kilcher · 11.06.20 · 35,2 тыс. просм.
48 мин
🧠 Нужен ли трансформерам Self-Attention? Мнение блогера Янника Кильхера
Yannic Kilcher · 31.05.20 · 17,1 тыс. просм.
48 мин
Янник Кильхер о Synthesizer: переосмысление внимания в Transformer
Yannic Kilcher · 31.05.20 · 17,2 тыс. просм.
31 мин
🧠 TAPAS: как нейросети учатся «читать» таблицы без SQL
Yannic Kilcher · 05.05.20 · 9,7 тыс. просм.
11 мин
🛠 Янник Килчер: «Blender — это инженерное руководство, а не научный прорыв»
Yannic Kilcher · 03.05.20 · 15,7 тыс. просм.
1ч 40м
🛠 Google T5: новые горизонты обучения нейросетей
Machine Learning Street Talk · 24.04.20 · 6 тыс. просм.
26 мин
Longformer: как эффективно анализировать длинные документы
Yannic Kilcher · 20.04.20 · 26,3 тыс. просм.
18 мин
🧱 Янник Килчер об Imputer: баланс скорости и точности в распознавании речи
Yannic Kilcher · 14.04.20 · 2 тыс. просм.
24 мин
🧠 Deep Learning в символьной математике: как Facebook AI обошли Mathematica
Yannic Kilcher · 24.02.20 · 6,1 тыс. просм.
29 мин
🧠 Как уместить 64 000 токенов в одну видеокарту: разбор нейросети Reformer
Yannic Kilcher · 22.01.20 · 21,5 тыс. просм.
23 мин
🕒 Как параллельное декодирование ускоряет авторегрессионные модели в 7 раз
Yannic Kilcher · 06.05.19 · 1,3 тыс. просм.
27 мин
🧠 Янник Килчер о GPT-2: «Модель учится задачам без обучения»
Yannic Kilcher · 18.02.19 · 34,9 тыс. просм.
27 мин
Янник Килхер о «Attention Is All You Need»: революция в NLP
Yannic Kilcher · 28.11.17 · 776 тыс. просм.