Transformers

73 статей

1ч 17м
🧠 Джейкоб Андреас: «Как современные языковые модели учатся рассуждать»
MIT OpenCourseWare · 11.02 · 2,5 тыс. просм.
1ч 13м
🕒 Сэра Бири из MIT об эволюции архитектур памяти нейросетей
MIT OpenCourseWare · 11.02 · 2,3 тыс. просм.
1ч 14м
💍 Филипп Изола: «Трансформер — это кольцо всевластия в современном ИИ»
MIT OpenCourseWare · 11.02 · 4,6 тыс. просм.
1ч 14м
🤖 Технологии LLM и RAG в MIT: как работают современные языковые модели
MIT OpenCourseWare · 07.01 · 11 тыс. просм.
1ч 16м
🌍 Как устроена архитектура Transformers и зачем ей скалярное произведение
MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.
1ч 16м
🛠 «Они захватили всё»: Рама Рамакришнан о принципах работы трансформеров
MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.
1ч 51м
🚀 Стэнфорд CME295: Итоги 2025 года в мире трансформеров и диффузионных моделей
Stanford Online · 09.12.25 · 123 тыс. просм.
1ч 51м
🔄 Будущее LLM в 2025 году: от авторегрессии к диффузии и аналоговым чипам
Stanford Online · 09.12.25 · 123 тыс. просм.
1ч 06м
🔄 Стэнфордский курс CS231N: эволюция механизма внимания и архитектуры трансформеров
Stanford Online · 02.09.25 · 33,5 тыс. просм.
1ч 08м
🔄 Как свёрточные нейросети победили ручные признаки: лекция в Стэнфорде
Stanford Online · 02.09.25 · 37,7 тыс. просм.
1ч 13м
🎥 Как трансформеры совершили революцию в видеогенерации: разбор архитектуры Movie Gen от Meta
Stanford Online · 03.07.25 · 15,5 тыс. просм.
1ч 10м
🌍 Эшед Маргалит: «Мы создали симулятор для 6 миллиардов виртуальных клеток опухоли»
Stanford Online · 13.06.25 · 11 тыс. просм.
3ч 28м
🚀 Иллюзия разума: математика и архитектура современных LLM
freeCodeCamp.org · 24.04.25 · 87,2 тыс. просм.
1ч 01м
🧠 От «детских» данных до нейронауки: лекция Stanford CS25
Stanford Online · 18.04.25 · 39,6 тыс. просм.
👓 Почему большие языковые модели теряют информацию в длинных текстах
Machine Learning Street Talk · 08.03.25 · 19,8 тыс. просм.
👓 Почему нейросети «близоруки»: Федерико Барберо о фундаментальных изъянах внимания
Machine Learning Street Talk · 08.03.25 · 19,8 тыс. просм.
1ч 17м
📊 Лекция Стэнфорда CS224N: основы механизма внимания и оценка перевода
Stanford Online · 04.03.25 · 21 тыс. просм.
51 мин
🧠 Зепп Хохрайтер: «Мы работаем быстрее самого быстрого трансформера»
Eye on AI · 22.01.25 · 1 тыс. просм.
1ч 12м
🌱 Юрген Шмидхубер: от истоков глубокого обучения до колонизации космоса
Machine Learning Street Talk · 16.01.25 · 24,4 тыс. просм.
47 мин
🤖 Эмодзи вместо тикера: как Hugging Face стал центром открытого ИИ
Eye on AI · 13.11.24 · 680 просм.
14 мин
🎮 Как нейросеть Oasis генерирует игры в реальном времени без программного кода
Wes Roth · 08.11.24 · 16,2 тыс. просм.
32 мин
🧩 Является ли ChatGPT продвинутой моделью н-грамм? Исследование Тимоти Нгуена
Machine Learning Street Talk · 15.08.24 · 15,7 тыс. просм.
1ч 05м
Сара Хукер: «Вычислительные пороги ИИ — это ошибочная стратегия»
Machine Learning Street Talk · 18.07.24 · 18,2 тыс. просм.
1ч 42м
Альберт Гу о революции State Space Models: «Mamba меняет всё»
The Cognitive Revolution · 04.07.24 · 4 тыс. просм.
42 мин
🚀 MIT: как ИИ-трансформеры ускоряют посадку космических кораблей
Stanford Online · 21.06.24 · 4,9 тыс. просм.
2ч 15м
🧠 Миф об универсальности трансформеров: взгляд Франсуа Шолле
Machine Learning Street Talk · 18.06.24 · 59,2 тыс. просм.
2ч 15м
🧩 ARC Challenge: как ИИ учится рассуждать по-человечески
Machine Learning Street Talk · 18.06.24 · 59,2 тыс. просм.
1ч 19м
🚀 Мин Дин из Zhipu AI: от языковых моделей к мультимодальным системам будущего
Stanford Online · 30.05.24 · 14,4 тыс. просм.
1ч 04м
🏗 Разреженная смесь экспертов: детальный разбор архитектуры Mixtral 8x7B
Stanford Online · 16.05.24 · 11,6 тыс. просм.
1ч 17м
🕰 Эволюция нейросетей: от «Attention Is All You Need» до агентов L5
Stanford Online · 23.04.24 · 76 тыс. просм.