Transformers

73 статей

🧠 Джейкоб Андреас: «Как современные языковые модели учатся рассуждать»

MIT OpenCourseWare · 11.02 · 2,5 тыс. просм.

🕒 Сэра Бири из MIT об эволюции архитектур памяти нейросетей

MIT OpenCourseWare · 11.02 · 2,3 тыс. просм.

💍 Филипп Изола: «Трансформер — это кольцо всевластия в современном ИИ»

MIT OpenCourseWare · 11.02 · 4,6 тыс. просм.

🤖 Технологии LLM и RAG в MIT: как работают современные языковые модели

MIT OpenCourseWare · 07.01 · 11 тыс. просм.

🌍 Как устроена архитектура Transformers и зачем ей скалярное произведение

MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.

🛠 «Они захватили всё»: Рама Рамакришнан о принципах работы трансформеров

MIT OpenCourseWare · 07.01 · 11,8 тыс. просм.

🚀 Стэнфорд CME295: Итоги 2025 года в мире трансформеров и диффузионных моделей

Stanford Online · 09.12.25 · 123 тыс. просм.

🔄 Будущее LLM в 2025 году: от авторегрессии к диффузии и аналоговым чипам

Stanford Online · 09.12.25 · 123 тыс. просм.

🔄 Стэнфордский курс CS231N: эволюция механизма внимания и архитектуры трансформеров

Stanford Online · 02.09.25 · 33,5 тыс. просм.

🔄 Как свёрточные нейросети победили ручные признаки: лекция в Стэнфорде

Stanford Online · 02.09.25 · 37,7 тыс. просм.

🎥 Как трансформеры совершили революцию в видеогенерации: разбор архитектуры Movie Gen от Meta

Stanford Online · 03.07.25 · 15,5 тыс. просм.

🌍 Эшед Маргалит: «Мы создали симулятор для 6 миллиардов виртуальных клеток опухоли»

Stanford Online · 13.06.25 · 11 тыс. просм.

🚀 Иллюзия разума: математика и архитектура современных LLM

freeCodeCamp.org · 24.04.25 · 87,2 тыс. просм.

🧠 От «детских» данных до нейронауки: лекция Stanford CS25

Stanford Online · 18.04.25 · 39,6 тыс. просм.

👓 Почему большие языковые модели теряют информацию в длинных текстах

Machine Learning Street Talk · 08.03.25 · 19,8 тыс. просм.

👓 Почему нейросети «близоруки»: Федерико Барберо о фундаментальных изъянах внимания

Machine Learning Street Talk · 08.03.25 · 19,8 тыс. просм.

📊 Лекция Стэнфорда CS224N: основы механизма внимания и оценка перевода

Stanford Online · 04.03.25 · 21 тыс. просм.

🧠 Зепп Хохрайтер: «Мы работаем быстрее самого быстрого трансформера»

Eye on AI · 22.01.25 · 1 тыс. просм.

🌱 Юрген Шмидхубер: от истоков глубокого обучения до колонизации космоса

Machine Learning Street Talk · 16.01.25 · 24,4 тыс. просм.

🤖 Эмодзи вместо тикера: как Hugging Face стал центром открытого ИИ

Eye on AI · 13.11.24 · 680 просм.

🎮 Как нейросеть Oasis генерирует игры в реальном времени без программного кода

Wes Roth · 08.11.24 · 16,2 тыс. просм.

🧩 Является ли ChatGPT продвинутой моделью н-грамм? Исследование Тимоти Нгуена

Machine Learning Street Talk · 15.08.24 · 15,7 тыс. просм.

Сара Хукер: «Вычислительные пороги ИИ — это ошибочная стратегия»

Machine Learning Street Talk · 18.07.24 · 18,2 тыс. просм.

Альберт Гу о революции State Space Models: «Mamba меняет всё»

The Cognitive Revolution · 04.07.24 · 4 тыс. просм.

🚀 MIT: как ИИ-трансформеры ускоряют посадку космических кораблей

Stanford Online · 21.06.24 · 4,9 тыс. просм.

🧠 Миф об универсальности трансформеров: взгляд Франсуа Шолле

Machine Learning Street Talk · 18.06.24 · 59,2 тыс. просм.

🧩 ARC Challenge: как ИИ учится рассуждать по-человечески

Machine Learning Street Talk · 18.06.24 · 59,2 тыс. просм.

🚀 Мин Дин из Zhipu AI: от языковых моделей к мультимодальным системам будущего

Stanford Online · 30.05.24 · 14,4 тыс. просм.

🏗 Разреженная смесь экспертов: детальный разбор архитектуры Mixtral 8x7B

Stanford Online · 16.05.24 · 11,6 тыс. просм.

🕰 Эволюция нейросетей: от «Attention Is All You Need» до агентов L5

Stanford Online · 23.04.24 · 76 тыс. просм.