RDLY
.ru
Тренды
Статьи
Темы
Люди
Transformers
73 статей
1ч 17м
🧠 Джейкоб Андреас: «Как современные языковые модели учатся рассуждать»
MIT OpenCourseWare · 11.02 · 2,5 тыс. просм.
1ч 13м
🕒 Сэра Бири из MIT об эволюции архитектур памяти нейросетей
MIT OpenCourseWare · 11.02 · 2,3 тыс. просм.
1ч 14м
💍 Филипп Изола: «Трансформер — это кольцо всевластия в современном ИИ»
MIT OpenCourseWare · 11.02 · 4,6 тыс. просм.
1ч 14м
🤖 Технологии LLM и RAG в MIT: как работают современные языковые модели
MIT OpenCourseWare · 07.01 · 11 тыс. просм.
1ч 16м
🌍 Как устроена архитектура Transformers и зачем ей скалярное произведение
MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.
1ч 16м
🛠 «Они захватили всё»: Рама Рамакришнан о принципах работы трансформеров
MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.
1ч 51м
🚀 Стэнфорд CME295: Итоги 2025 года в мире трансформеров и диффузионных моделей
Stanford Online · 09.12.25 · 123 тыс. просм.
1ч 51м
🔄 Будущее LLM в 2025 году: от авторегрессии к диффузии и аналоговым чипам
Stanford Online · 09.12.25 · 123 тыс. просм.
1ч 06м
🔄 Стэнфордский курс CS231N: эволюция механизма внимания и архитектуры трансформеров
Stanford Online · 02.09.25 · 33,5 тыс. просм.
1ч 08м
🔄 Как свёрточные нейросети победили ручные признаки: лекция в Стэнфорде
Stanford Online · 02.09.25 · 37,7 тыс. просм.
1ч 13м
🎥 Как трансформеры совершили революцию в видеогенерации: разбор архитектуры Movie Gen от Meta
Stanford Online · 03.07.25 · 15,5 тыс. просм.
1ч 10м
🌍 Эшед Маргалит: «Мы создали симулятор для 6 миллиардов виртуальных клеток опухоли»
Stanford Online · 13.06.25 · 11 тыс. просм.
3ч 28м
🚀 Иллюзия разума: математика и архитектура современных LLM
freeCodeCamp.org · 24.04.25 · 87,2 тыс. просм.
1ч 01м
🧠 От «детских» данных до нейронауки: лекция Stanford CS25
Stanford Online · 18.04.25 · 39,6 тыс. просм.
1ч
👓 Почему большие языковые модели теряют информацию в длинных текстах
Machine Learning Street Talk · 08.03.25 · 19,8 тыс. просм.
1ч
👓 Почему нейросети «близоруки»: Федерико Барберо о фундаментальных изъянах внимания
Machine Learning Street Talk · 08.03.25 · 19,8 тыс. просм.
1ч 17м
📊 Лекция Стэнфорда CS224N: основы механизма внимания и оценка перевода
Stanford Online · 04.03.25 · 21 тыс. просм.
51 мин
🧠 Зепп Хохрайтер: «Мы работаем быстрее самого быстрого трансформера»
Eye on AI · 22.01.25 · 1 тыс. просм.
1ч 12м
🌱 Юрген Шмидхубер: от истоков глубокого обучения до колонизации космоса
Machine Learning Street Talk · 16.01.25 · 24,4 тыс. просм.
47 мин
🤖 Эмодзи вместо тикера: как Hugging Face стал центром открытого ИИ
Eye on AI · 13.11.24 · 680 просм.
14 мин
🎮 Как нейросеть Oasis генерирует игры в реальном времени без программного кода
Wes Roth · 08.11.24 · 16,2 тыс. просм.
32 мин
🧩 Является ли ChatGPT продвинутой моделью н-грамм? Исследование Тимоти Нгуена
Machine Learning Street Talk · 15.08.24 · 15,7 тыс. просм.
1ч 05м
Сара Хукер: «Вычислительные пороги ИИ — это ошибочная стратегия»
Machine Learning Street Talk · 18.07.24 · 18,2 тыс. просм.
1ч 42м
Альберт Гу о революции State Space Models: «Mamba меняет всё»
The Cognitive Revolution · 04.07.24 · 4 тыс. просм.
42 мин
🚀 MIT: как ИИ-трансформеры ускоряют посадку космических кораблей
Stanford Online · 21.06.24 · 4,9 тыс. просм.
2ч 15м
🧠 Миф об универсальности трансформеров: взгляд Франсуа Шолле
Machine Learning Street Talk · 18.06.24 · 59,2 тыс. просм.
2ч 15м
🧩 ARC Challenge: как ИИ учится рассуждать по-человечески
Machine Learning Street Talk · 18.06.24 · 59,2 тыс. просм.
1ч 19м
🚀 Мин Дин из Zhipu AI: от языковых моделей к мультимодальным системам будущего
Stanford Online · 30.05.24 · 14,4 тыс. просм.
1ч 04м
🏗 Разреженная смесь экспертов: детальный разбор архитектуры Mixtral 8x7B
Stanford Online · 16.05.24 · 11,6 тыс. просм.
1ч 17м
🕰 Эволюция нейросетей: от «Attention Is All You Need» до агентов L5
Stanford Online · 23.04.24 · 76 тыс. просм.
1ч
🎓 Ведущий ученый Waymo Драго об архитектуре автопилота и Tesla
Eye on AI · 21.04.24 · 4,2 тыс. просм.
44 мин
🚀 Янник Кильчер о Searchformer: «Обучение модели мышлению действительно работает»
Yannic Kilcher · 06.04.24 · 37 тыс. просм.
1ч 16м
📈 Эра гибридных архитектур: сможет ли Mamba вытеснить Трансформеры?
The Cognitive Revolution · 30.03.24 · 1,9 тыс. просм.
12 мин
🤖 От Элайзы до ChatGPT: Как история первого чат-бота объясняет наш восторг перед ИИ
The Vergecast · 28.02.24 · 86,7 тыс. просм.
1ч 33м
🧩 Брэндон Рорер: «ИИ — это всего лишь очень умная машина для перемалывания паттернов»
Machine Learning Street Talk · 13.02.24 · 36,8 тыс. просм.
40 мин
🧠 Mamba против Transformers: как селективные пространства состояний решают проблему длинного контекста
Yannic Kilcher · 24.12.23 · 173 тыс. просм.
44 мин
📉 Янник Килчер на NeurIPS 2023: главные тренды нейросетей
Yannic Kilcher · 16.12.23 · 10,6 тыс. просм.
3ч 57м
🧠 Механистическая интерпретируемость: как декомпилировать разум нейросети
Machine Learning Street Talk · 28.10.23 · 140 тыс. просм.
44 мин
🔍 GOAT против графов: как Capital One внедряет Трансформеры в финансовые сети
The TWIML AI Podcast · 07.08.23 · 784 просм.
1ч 32м
🤖 Мегабайты вместо токенов: Революция в архитектуре ИИ от Meta
The Cognitive Revolution · 29.06.23 · 1,3 тыс. просм.
35 мин
🧠 Дэн Фу рассказал о применении моделей пространства состояний в языковом моделировании
The TWIML AI Podcast · 22.05.23 · 2,2 тыс. просм.
42 мин
🛠 Генеративный ИИ на устройствах: как Qualcomm адаптирует чипы под трансформеры
The TWIML AI Podcast · 03.04.23 · 1,6 тыс. просм.
37 мин
🧠 Терри Сейновски: «Люди — это языковые модели в мозге приматов»
Eye on AI · 01.02.23 · 2 тыс. просм.
54 мин
🎥 Ян Лекун: «AGI не существует, человеческий интеллект специализирован»
Eye on AI · 20.10.22 · 2,8 тыс. просм.
52 мин
🏦 Баян Брусс из Capital One: Почему трансформеры захватывают табличные данные
The TWIML AI Podcast · 12.09.22 · 3 тыс. просм.
52 мин
🎓 Томас Вольф: «Текст — это стена, в которую упирается развитие ИИ»
The TWIML AI Podcast · 21.03.22 · 1,3 тыс. просм.
1ч 18м
🧠 Андрей Шмогенов рассказал о генерации весов нейросетей через HyperTransformer
Yannic Kilcher · 16.02.22 · 17,7 тыс. просм.
1ч 23м
🍦 «NLP пожирает машинное обучение»: Джон Боханнон о трендах индустрии
The TWIML AI Podcast · 06.01.22 · 2,3 тыс. просм.
56 мин
🛠 Ориоль Виньялс: «Масштабирование — это не единственный путь к интеллекту»
The TWIML AI Podcast · 20.12.21 · 1,4 тыс. просм.
41 мин
🧠 Как научить ИИ размышлять: Андреа Банино о механизмах PonderNet
The TWIML AI Podcast · 18.10.21 · 570 просм.
3ч 33м
🧩 Геометрическое глубокое обучение: как симметрия объединяет нейросети
Machine Learning Street Talk · 19.09.21 · 414 тыс. просм.
31 мин
🧩 Янник Килчер разобрал метод ALiBi для экстраполяции контекста трансформеров
Yannic Kilcher · 02.09.21 · 22,3 тыс. просм.
2ч 30м
🧠 Self-Supervised Learning: эволюция зрения от алгоритмов к разуму
Lex Fridman · 31.07.21 · 140 тыс. просм.
41 мин
🧠 Обучение ИИ забыванию: подробный разбор архитектуры Expire-Span от Янника Килчера
Yannic Kilcher · 24.05.21 · 10,7 тыс. просм.
34 мин
⚠ Конец эпохи Attention? Как Google заменил внимание школьной математикой
Yannic Kilcher · 21.05.21 · 30 тыс. просм.
10 мин
🧠 Питер Аббиль: «Языковые модели не так уж специализированы для языка»
The TWIML AI Podcast · 21.04.21 · 509 просм.
1ч 05м
🤖 Питер Аббил: «Роботы должны учиться как дети»
The TWIML AI Podcast · 19.04.21 · 9 тыс. просм.
29 мин
🧩 Янник Килхер: «Perceiver — это новый этап эволюции трансформеров»
Yannic Kilcher · 22.03.21 · 59,8 тыс. просм.
34 мин
🧠 Языковые модели как универсальные вычислители: разбор исследования от Янника Кильчера
Yannic Kilcher · 16.03.21 · 23,7 тыс. просм.
34 мин
🧠 Янник Килхер разобрал гипотезу трансформеров как универсальных вычислителей
Yannic Kilcher · 16.03.21 · 23,7 тыс. просм.
53 мин
🎓 Драго Ангелов рассказал об архитектуре беспилотных автомобилей Waymo
The TWIML AI Podcast with Sam Charrington · 26.02.21 · 3,9 тыс. просм.
55 мин
🥑 Янник Кильхер разобрал архитектуру и ограничения нейросети DALL·E
Yannic Kilcher · 06.01.21 · 105 тыс. просм.
54 мин
🧬 DeepMind: как архитектура трансформеров решила задачу 50-летней давности
Yannic Kilcher · 01.12.20 · 241 тыс. просм.
54 мин
🛑 Как архитектура Performers решает проблему квадратичной сложности классических трансформеров
Yannic Kilcher · 26.10.20 · 58,8 тыс. просм.
46 мин
🧠 Крис Маннинг: «Простое масштабирование — не путь к AGI»
DeepLearning.AI · 14.10.20 · 18,2 тыс. просм.
1ч 37м
🧠 Алекс Стэнли о возвращении к ядерным методам в эпоху трансформеров
Machine Learning Street Talk · 18.09.20 · 22,9 тыс. просм.
1ч 05м
🧠 Связь сетей Хопфилда и механизмов внимания в современных ИИ-моделях
Yannic Kilcher · 09.08.20 · 112 тыс. просм.
34 мин
🧱 Янник Килчер разобрал архитектуру разреженного внимания модели Big Bird
Yannic Kilcher · 02.08.20 · 25,8 тыс. просм.
48 мин
⚠ Как превратить трансформер в RNN и ускорить его в 4000 раз?
Yannic Kilcher · 04.07.20 · 29 тыс. просм.
34 мин
🛑 Сможет ли случайная матрица заменить обратное распространение ошибки?
Yannic Kilcher · 27.06.20 · 18,2 тыс. просм.
40 мин
🛠 Янник Кильхер о DETR: «Эта архитектура суперпроста по сравнению с предшественниками»
Yannic Kilcher · 28.05.20 · 172 тыс. просм.
9 мин
🧩 Илья Суцкевер: «Зрение и язык — это одна и та же задача для ИИ»
Lex Fridman · 10.05.20 · 36 тыс. просм.
40 мин
🤖 Как и почему BERT произвел революцию в понимании языка нейросетями
Yannic Kilcher · 30.01.19 · 112 тыс. просм.