Янник Килхер о новом обучаемом оптимизаторе от Google: «Интересно, но сыро»

Yannic Kilcher 19,6 тыс. 53 мин 3 мин 03.10.2020
Главное

Оптимизация оптимизаторов: Будущее обучения нейронных сетей

Исследователи из Google, включая Люка Метца (Luke Metz) и его коллег, представили амбициозную работу по созданию «обучаемых оптимизаторов» — алгоритмов, которые способны самостоятельно обучаться и затем эффективно тренировать другие модели машинного обучения. По мнению автора канала Yannic Kilcher, это направление является попыткой совершить такой же качественный скачок в области оптимизации, какой в свое время совершило глубокое обучение при переходе от ручной настройки признаков к их автоматическому изучению.

Что такое обучаемые оптимизаторы и зачем они нужны?

Традиционные методы оптимизации, такие как градиентный спуск, SGD с моментом или Adam, полагаются на математические формулы, «выведенные» человеком.

Архитектура: LSTM и «грязная» инженерия признаков

В основе предложенного решения лежит иерархическая структура, использующая LSTM и полносвязные сети (MLP) для каждого обучаемого параметра.

Обучение через эволюцию

Основная проблема обучения таких систем — невозможность прямого обратного распространения ошибки через тысячи шагов оптимизации.

Результаты и главный парадокс

Авторы сравнивают свой оптимизатор с классическими методами, подчеркивая отсутствие необходимости в настройке гиперпараметров (например, скорости обучения) после завершения процесса обучения.

Финальный вердикт

В завершающем эксперименте модель попытались использовать для обучения самой себя («саморекурсия» оптимизатора), однако результаты показали, что она не может достичь такого же качества, как при обучении стандартными методами.

Автор видео резюмирует, что это «крутая работа» с точки зрения академического поиска, но в текущем виде она ограничена вычислительными мощностями и неясностью архитектурных решений. Отдельно Янник Килхер раскритиковал раздел «Более широкое влияние» (Broader Impact), назвав его «мемом» из-за шаблонных фраз о том, что технологии — это просто «хорошо, плохо или предвзято», без реального анализа конкретных рисков данной работы.

💬 Цитаты

«Глубокое обучение — это, по сути, просто замена части, создающей признаки.»

Янник Килхер 03:48

«Нам не нужны гиперпараметры, но в процессе обучения самого оптимизатора их огромное количество.»

Янник Килхер 47:39
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Обучаемый оптимизатор
Функция, которая сама учится обновлять веса нейронной сети, вместо использования стандартных формул.
Эволюционные стратегии
Метод оптимизации, вдохновленный биологической эволюцией, который не требует вычисления градиентов.
Adam
Популярный алгоритм адаптивной оптимизации, используемый для тренировки глубоких нейронных сетей.
Гиперпараметры
Параметры алгоритма, которые задаются до начала обучения и влияют на качество результата.
Неявная регуляризация
Эффект, при котором процесс оптимизации естественным образом ограничивает сложность модели, предотвращая переобучение.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Google Research Learned Optimizers Yannic Kilcher Evolution Strategies Machine Learning