Янник Кильхер: «SOTA — это магическое слово, заставляющее рецензентов нажимать Accept»

Yannic Kilcher 22,7 тыс. 14 мин 3 мин 24.12.2020
Главное

В новом выпуске своего ироничного обзора мемов исследователь ИИ Янник Кильхер (Yannic Kilcher) и его гость Антонио обсуждают современное состояние глубокого обучения. Собеседники разбирают, как трансформеры захватывают мир ИИ, почему академическое рецензирование превратилось в магический ритуал и чем виртуальные конференции в разгар пандемии напоминают шпионские игры.

🪄 Магия машинного обучения и закат эпохи Matlab 0:00

Несмотря на глубокое понимание математических основ, машинное обучение всё ещё воспринимается практикующими специалистами как некая форма магии . Антонио отмечает, что даже когда ты понимаешь внутреннее устройство алгоритмов, результат их работы часто вызывает удивление.

В контексте инструментов разработки участники дискуссии затронули судьбу Matlab. По ироничному замечанию Янника Кильхера, в мире осталось «всего около семи пользователей Matlab», и потеря хотя бы одного подписчика может привести к массовым увольнениям в компании-разработчике . В качестве альтернативы для тех, кто ищет «PyTorch на минималках», упоминается Scikit-learn, который в сообществе в шутку называют «домашним PyTorch» .

🥨 Виртуальные конференции и этика «сталкерства» 2:35

Пандемия COVID-19 перенесла научное общение в виртуальные пространства вроде Gather.town. Собеседники вспоминают курьёзные моменты этого формата:

📄 Культ SOTA и «магия» принятия статей 6:11

Одной из центральных тем обсуждения стала одержимость исследователей показателем SOTA (State of the Art — лучший результат на текущий момент). По мнению Антонио, аббревиатура SOTA в тексте статьи действует на рецензентов магически: они словно возносятся к небесам, а их рука сама тянется к кнопке «Accept» (принять статью) .

Исследователи выделяют несколько трендов в современных публикациях:

  1. Замена архитектур: Сейчас для получения SOTA достаточно просто заменить рекуррентные нейросети (RNN) или сверточные сети (ConvNets) на трансформеры .
  2. Многоголовое внимание (Multi-head attention): Антонио называет этот механизм «лучшим видом внимания», превосходящим даже потребность в еде и сне .
  3. Агрессивное рецензирование: Янник описывает типичное поведение «злого» рецензента, который может уничтожить работу, просто добавив список из десяти цитат на статьи, которые авторы якобы проигнорировали .

🤖 OpenAI, GPT-3 и «анонимность» 4:19

Особую иронию у участников вызывает процесс двойного слепого рецензирования (double-blind review) для крупных лабораторий. Когда на проверку приходит статья по GPT-3, всем очевидно, что её автором является OpenAI, что превращает анонимность в формальность .

Также обсуждается способность ИИ предсказывать фондовый рынок. Янник отмечает:

🛠 Кризис дизайна TensorFlow и триумф PyTorch 11:43

Янник Кильхер подверг резкой критике архитектуру TensorFlow, особенно попытку внедрить режим Eager Execution. По его словам, исходный код TensorFlow буквально усеян проверками if eager ... else ..., что делает его похожим на два разных фреймворка, грубо склеенных вместе в попытке догнать PyTorch .

Другие тезисы о фреймворках:

🕵️ Утечка данных и предсказания XKCD 9:17

Собеседники обратили внимание на комикс XKCD, где предиктивная модель случайно выдает секретную информацию (место и время встречи революционеров), обучившись на сообщениях пользователей . Янник подчеркивает, что эта шутка стала реальностью: совсем недавно вышла научная работа, доказывающая возможность извлечения обучающих данных из больших языковых моделей .

💬 Цитаты

«Если вы напишете магические буквы SOTA, рецензенты магическим образом поднимутся со своих кресел к небесам.»

«Исходный код TensorFlow завален условиями 'if eager then...'. Это как два фреймворка, склеенных вместе.»

Янник Кильхер 13:26
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
SOTA (State of the Art)
Наивысший уровень развития технологии или лучший результат в тестах на текущий момент.
Multi-head attention
Ключевой механизм архитектуры трансформеров, позволяющий модели фокусироваться на разных частях входных данных одновременно.
Eager Execution
Режим в TensorFlow, который выполняет операции немедленно, без построения графа вычислений.
📊 Цифры
🗓 Хронология
  1. 2016 Пик популярности TensorFlow и конференции NIPS.
  2. 2020 Выход статьи про GPT-3 и активное использование Gather.town для конференций.
  3. 2021 Трансформеры начинают доминировать не только в тексте, но и в компьютерном зрении.
⚖️ Другая сторона
Искусственный интеллект Yannic Kilcher OpenAI PyTorch TensorFlow SOTA