Скандал на ICCV, критика Stanford HAI и робот-танцор Илона Маска: обзор новостей ML

Yannic Kilcher 28,9 тыс. 32 мин 4 мин 27.08.2021
Главное

В новом выпуске ML News Янник Килчер разбирает громкий скандал с плагиатом на конференции ICCV, критикует масштабный манифест Стэнфорда о «фундаментальных моделях» и иронизирует над анонсом человекоподобного робота Tesla. Главными темами стали этика научных публикаций, попытки ребрендинга давно известных технологий и новинки в области аппаратного обеспечения для ИИ.

🚨 Скандал в научном сообществе: плагиат на ICCV 3:07

В центре внимания оказался инцидент с копированием научной работы, который Янник Килчер называет «вопиющим случаем» . Конфликт развернулся вокруг двух работ: оригинальной статьи «Momentum Residual Neural Networks» (авторы из DeepMind, CNRS и Google Research) и статьи-клона под названием «M-RedNet: Deep Reversible Neural Networks with Momentum» .

По словам Янника Килчера, сходство между работами было настолько очевидным, что вторая статья казалась просто переформулированным вариантом первой .

Ключевые факты инцидента:

Янник Килчер отмечает, что подобные случаи в машинном обучении часто остаются незамеченными . По его мнению, в данном случае плагиат был настолько «наглым», что автору не удалось оправдаться стандартными фразами о «похожих идеях» . В итоге конференция ICCV официально подтвердила, что работа не будет опубликована .

🏛️ Stanford HAI и попытка захвата терминологии: Foundation Models 11:57

Стэнфордский институт ИИ (Stanford HAI) выпустил массивный 200-страничный документ под названием «On the Opportunities and Risks of Foundation Models» . В написании участвовало огромное количество сотрудников университета, что вызвало у Янника Килчера скепсис относительно авторства.

Критика Янника Килчера:

  1. Проблема авторства: По мнению ведущего, это не цельная научная работа, а «компендиум» или сборник статей . Он утверждает, что над разными секциями работали разные группы людей, и общая цитируемость всех авторов за чужие разделы кажется ему «игрой с академической системой цитирований» .
  2. Ребрендинг старого: Килчер полагает, что термин «Foundation Models» (фундаментальные модели) — это просто попытка переименовать уже существующие большие предобученные модели (такие как BERT, GPT-3 или CLIP) .
  3. Размытость определений: Янник считает определение «фундаментальной модели» слишком широким. Если под него подпадает GPT-3, то, по его логике, туда же должна относиться и классическая архитектура ResNet-50, обученная на ImageNet .

Ведущий подчеркивает, что выводы в статье часто не вытекают из самого определения. Например, риски потери доступности или вреда экологии обсуждаются как свойства «фундаментальных моделей», хотя, по мнению Килчера, это лишь особенности конкретных реализаций современных LLM, а не обязательное следствие определения .

🤖 Tesla AI Day: от суперкомпьютеров до танцоров в трико 21:40

Мероприятие Tesla AI Day запомнилось не только техническими деталями, но и экстравагантным анонсом Tesla Bot.

Основные тезисы обсуждения:

Параллельно с успехами Tesla упоминается проект Comma 3 от Джорджа Хотца. В отличие от закрытой экосистемы Tesla, Comma придерживается принципов Open Source, предлагая сообществу разработчиков участвовать в создании систем помощи водителю .

🔌 Новости аппаратного обеспечения: Intel уходит, IBM наступает 24:50

В мире «железа» для ИИ произошли важные перестановки. Intel объявила о сворачивании подразделения RealSense, которое занималось разработкой 3D-камер и сенсоров .

Контекст событий:

🎮 ИИ в спорте и играх 20:48

Facebook AI Research опубликовала работу о стратегиях управления персонажами в соревновательных видах спорта (например, боксе) в симулированной среде .

Наблюдения Килчера:

  1. Алгоритмы обучения с подкреплением (RL) смогли выработать сложные политики контроля для гуманоидов с большим количеством степеней свободы .
  2. Ведущего впечатлило, как агенты учатся держать баланс и одновременно проводить атаки, что технически является крайне сложной задачей .

Также упоминаются новые соревнования на Kaggle, такие как «Lux AI» (сбор ресурсов в условиях выживания) и «Neural MMO», где агенты взаимодействуют в огромном открытом мире с множеством других игроков .

🧐 Проблемы в области Multi-Agent RL 27:45

Янник обратил внимание на дискуссию в Reddit, где исследователи жалуются на «нечестные приемы» в статьях по многоагентному обучению с подкреплением (MARL) на топовых конференциях .

Суть претензий, озвученных в сообществе:

💬 Цитаты

«Похоже, это просто игра с системой цитирований: ваше имя в списке, и вы получаете цитату, даже если писали другой раздел.»

Янник Килчер 13:31

«Если GPT-3 считается фундаментальной моделью, то и ResNet-50 безусловно ей является.»

Янник Килчер 16:48

«После поедания дыни в течение нескольких дней... Это станет моей новой любимой фразой.»

Янник Килчер 09:21
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Foundation Models
Термин, предложенный Стэнфордом для обозначения больших моделей, обученных на огромных массивах данных, которые можно адаптировать под разные задачи.
ICCV
Международная конференция по компьютерному зрению, одна из самых престижных в области ИИ.
ResNet
Популярная архитектура глубоких нейронных сетей, использующая остаточные связи (skip-connections).
📊 Цифры
🗓 Хронология
  1. Август 2021 Янник получает сообщение о плагиате статьи, принятой на ICCV.
  2. Август 2021 Tesla проводит AI Day и анонсирует Tesla Bot.
  3. Август 2021 Stanford HAI публикует документ о Foundation Models.
⚖️ Другая сторона
Искусственный интеллект Stanford HAI Foundation Models Yannic Kilcher Tesla Bot ICCV