А

Андрей Шмогенов

Исследователь в Google, соавтор статьи про HyperTransformer.

2статьи
35 тыс.просмотров
2022период
1канал

💬 Заметные цитаты

«Мы можем отделить сложность маленькой модели для задач пользователя от сложности огромного трансформера, который знает все о мире.»
«Послойная генерация весов оказалась критической для стабилизации процесса: изменение ранних слоев кардинально меняет активации всей последующей сети.»
«В будущем мы увидим модели, генерирующие другие модели, и это действительно будет работать на практике.»

👥 Часто вместе с

📺 Где появляется

📈 Темы Few-Shot Learning2HyperTransformer2Андрей Шмогенов2Янник Килхер1Meta-Learning1Google1Transformers1

📺 Материалы с участием