RDLY
.ru
Тренды
Статьи
Темы
Mixture-of-Experts
18 статей
47 мин
🚀 Google представила Gemma 4: открытые ИИ-модели с лицензией Apache 2.0
Google for Developers · 22.05
2ч 13м
🚀 Экономика кремния: как физика памяти ограничивает развитие ИИ
Dwarkesh Patel · 29.04
17 мин
🛠 DeepSeek V4: конец американского доминирования в ИИ?
Matthew Berman · 25.04
1ч 48м
🏗 Стэнфорд CME295: Как работают Mixture of Experts и механизмы памяти в LLM
Stanford Online · 17.10.25
12 мин
🧠 OpenAI vs. DeepSeek vs. Qwen: архитектурная битва LLM
Y Combinator · 29.08.25
14 мин
🚀 Уэс Рот: «Qwen 3 — неожиданный прорыв, который обходит o3-mini и Gemini»
Wes Roth · 28.04.25
1ч 21м
🧠 Смесь экспертов: почему архитектура MoE стала стандартом для современных ИИ
Stanford Online · 24.04.25
19 мин
🧠 Computerphile: как DeepSeek разрушает монополию технологических гигантов
Computerphile · 28.01.25
19 мин
🧠 DeepSeek: конец эпохи монополии в мире ИИ?
Computerphile · 28.01.25
1ч 04м
🏗 Разреженная смесь экспертов: детальный разбор архитектуры Mixtral 8x7B
Stanford Online · 16.05.24
26 мин
❄ Уэс Рот о Snowflake Arctic: «Это огромная победа для открытого ИИ»
Wes Roth · 24.04.24
34 мин
🤐 Янник Килчер разобрал архитектуру Mixture of Experts от Mistral AI
Yannic Kilcher · 13.01.24
1ч 23м
🌐 Сара Хукер: «Колоссальная часть весов ИИ тратится на компенсацию зашумленных данных»
The TWIML AI Podcast · 16.10.23
52 мин
🧩 Архитектура Mixture-of-Experts и тренды масштабирования больших моделей от Ирвана Белло
The TWIML AI Podcast · 25.04.22
58 мин
🧩 Как архитектуры Switch Transformers и GLAM масштабируют ИИ до триллионов параметров
Yannic Kilcher · 21.04.22
33 мин
🚀 Switch Transformer: как Google упаковал триллион параметров в одну нейросеть
Yannic Kilcher · 22.01.21
1ч 13м
🔄 Янник Килчер разобрал архитектуру нейросети GShard на 600 миллиардов параметров
Yannic Kilcher · 01.07.20
1ч 13м
⚙ Янник Килчер: „GShard — это инженерный прорыв в масштабировании моделей“
Yannic Kilcher · 01.07.20