Трансформер

77 статей

🧠 От чат-бота к агенту: инженерный подход к LLM

freeCodeCamp.org · 07.07 · 14,4 тыс. просм.

🤖 Как устроены современные языковые модели: от обучения до системных ограничений

Stanford Online · 09.03 · 4,1 тыс. просм.

📉 Филип Изола: «Простые алгоритмы побеждают благодаря масштабированию»

MIT OpenCourseWare · 11.02 · 1,3 тыс. просм.

🧩 Как работают трансформеры: От self-attention до BERT и Hugging Face

MIT OpenCourseWare · 07.01 · 11,6 тыс. просм.

📉 Джейкоб из Manifest AI: «Будущее ИИ — это не трансформеры, а Power Retention»

Eye on AI · 09.11.25 · 3,2 тыс. просм.

🧭 От BERT до RoPE: Шервин и Афшин об эволюции архитектуры Transformer

Stanford Online · 17.10.25 · 137 тыс. просм.

🎓 Стэндфордский курс CME295: глубокое погружение в архитектуру Transformer

Stanford Online · 17.10.25 · 704 тыс. просм.

🏫 Эндрю Ын: «Совет не учиться программированию — это худший карьерный совет в истории»

Stanford Online · 01.10.25 · 587 тыс. просм.

🚀 Эволюция Transformer: как ускорить инференс и снизить VRAM

freeCodeCamp.org · 26.06.25 · 81,1 тыс. просм.

Генеративный ИИ в медицине: как работают большие языковые модели

Stanford Online · 30.04.25 · 39,9 тыс. просм.

🏗 Стэнфорд запустил курс CS336 по созданию LLM: от байтовых токенов до GPU-ядер

Stanford Online · 24.04.25 · 617 тыс. просм.

🧠 Смесь экспертов: почему архитектура MoE стала стандартом для современных ИИ

Stanford Online · 24.04.25 · 73,5 тыс. просм.

🧠 Педро Домингос: «Современный успех ИИ — это локальный оптимум, а не финал»

Eye on AI · 17.04.25 · 1,1 тыс. просм.

Стэнфорд о создании LLM: «Архитектура и гиперпараметры»

Stanford Online · 16.04.25 · 100 тыс. просм.

🏗 Как обучают современные модели: архитектурный консенсус

Stanford Online · 16.04.25 · 100 тыс. просм.

🧠 От Трансформеров к Jamba: Шохам о будущем корпоративного ИИ и Maestro

Eye on AI · 27.03.25 · 537 просм.

🕹 Microsoft Muse: как генеративный ИИ создает геймплей без программного кода

Wes Roth · 25.02.25 · 28,7 тыс. просм.

🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей

Andrej Karpathy · 05.02.25 · 6,2 млн просм.

🧠 Google: «Архитектура Titans копирует человеческую память для прорыва в ИИ»

Wes Roth · 16.01.25 · 46,8 тыс. просм.

💥 Юрген Шмидхубер о краже идей, природе сознания и колонизации космоса

Machine Learning Street Talk · 16.01.25 · 24,5 тыс. просм.

🧠 Экзокортекс в облаке: Андрей Карпати о будущем ИИ

Wes Roth · 09.09.24 · 48,5 тыс. просм.

🚗 Как Waymo обучает беспилотные автомобили с помощью генеративного ИИ

a16z (Andreessen Horowitz) · 05.08.24 · 5,6 тыс. просм.

⚖ Хён Вон Чун о будущем ИИ: «Масштабирование важнее структуры»

Stanford Online · 11.06.24 · 210 тыс. просм.

📉 Хён Вон Чон: «Масштабирование — главный драйвер будущего ИИ»

Stanford Online · 11.06.24 · 210 тыс. просм.

🧠 Как обучить нейросеть за 20 минут без GPU?

Stanford Online · 23.05.24 · 15,6 тыс. просм.

🧠 Авторегрессионные модели: от рекуррентных сетей к трансформерам и MLE

Stanford Online · 06.05.24 · 32,3 тыс. просм.

🧠 OpenAI в Стэнфорде: почему масштаб важнее архитектуры и как работает «магия» LLM

Stanford Online · 06.05.24 · 200 тыс. просм.

🔬 Внутри черного ящика ИИ: как методы Bow Lab раскрывают мышление нейросетей

The Cognitive Revolution · 05.04.24 · 1,7 тыс. просм.

🧬 Натан Ламберт о Mamba: «Это начало эпохи бесконечного контекста»

The Cognitive Revolution · 30.03.24 · 1 тыс. просм.

🚀 Как превратить нейросеть в читаемую программу: метод Дэна Фридмана

The TWIML AI Podcast · 15.01.24 · 848 просм.