Meta AI против цензуры: как научная модель Galactica стала жертвой «профессиональных жалобщиков»

Yannic Kilcher 45,1 тыс. 51 мин 4 мин 19.11.2022
Главное

В ноябре 2022 года компания Meta AI представила Galactica — амбициозную языковую модель, обученную на колоссальном массиве научных данных. Однако публичная демо-версия просуществовала всего три дня: после шквала критики в социальных сетях проект был спешно свернут. Исследователь ИИ Янник Кильчер (Yannic Kilcher) анализирует техническую ценность статьи и разбирает «драму», возникшую вокруг релиза, сравнивая страхи современных критиков с опасениями средневековых монахов перед печатным станком.

🎭 Драма вокруг демо-версии: почему Meta сдалась под давлением? 0:00

Релиз Galactica сопровождался громким скандалом. Несмотря на то что модель была выложена в открытый доступ, Meta AI удалила публичную демо-версию из-за массовых жалоб на «галлюцинации» и потенциальную «опасность» генерируемого контента .

Критику возглавили известные в индустрии фигуры:

Янник Кильчер и Ян Лекун (главный ученый Meta по ИИ) выступили в защиту проекта. По мнению Кильчера, критики ведут «игру за власть» и стремятся к централизации контроля над технологиями . Он сравнивает ситуацию с 1450-ми годами, когда изобретение Иоганна Гутенберга вызывало аналогичный ужас у монахов-переписчиков . Янник приводит воображаемый диалог, где монах утверждает, что «слово Божье должны интерпретировать священники, а не разносить его как навоз», опасаясь, что крестьяне начнут обсуждать Евангелие в тавернах .

🧠 Что такое Galactica: архитектура и цели 14:09

Galactica — это большая языковая модель (LLM), разработанная специально для работы с научным знанием. В отличие от общих моделей типа GPT-3, Galactica обучалась на курируемом корпусе данных.

Ключевые характеристики проекта:

По словам авторов статьи, Galactica способна находить скрытые связи между исследованиями и «подсвечивать» важные научные открытия, которые могли потеряться в огромном потоке ежедневно публикуемых статей .

🛠 Технические особенности и инновации 19:14

Разработчики Meta применили несколько уникальных подходов к обучению модели:

  1. Специальные токены для цитирования: Для предсказания ссылок используются токены [START_REF] и [END_REF]. Внутри указывается название статьи и имя первого автора . Это позволяет использовать модель как продвинутый поисковик по «связанным работам» .
  2. Токен <work> (Step-by-step reasoning): Это инновация для решения математических и физических задач. Токен имитирует «внутреннюю рабочую память» человека .
    • При обучении модель приучают подробно расписывать промежуточные вычисления.
    • В режиме инференса (работы) выполнение блока <work> можно передать внешнему обработчику, например, калькулятору или интерпретатору Python .
  3. Обработка данных:
    • Числа разбиваются на отдельные цифры для улучшения точности вычислений .
    • Химические соединения и белковые последовательности представлены в виде строк символов (SMILES и аминокислотные коды) .
  4. Prompt Pre-training: Инструкции для различных задач (решение задач, написание кода) включаются в процесс основного обучения, а не только на этапе тонкой настройки (fine-tuning) .

📈 Результаты тестирования и качество данных 38:22

Основной вывод статьи: качество данных важнее их количества. Galactica превосходит модели Bloom и OPT-175 на тестах Big Bench, несмотря на меньший размер обучающей выборки .

Основные достижения:

⚠️ Критика и этические вопросы 47:21

Несмотря на технологический успех, вопрос безопасности остается открытым. Противники модели указывают на риск генерации вредных советов. Например, пользователи смогли заставить демо-версию написать статью о пользе поедания битого стекла .

Янник Кильчер утверждает, что такие примеры — результат намеренной манипуляции пользователями («jailbreaking»). Он задает вопрос: «Кому на самом деле это повредило?» . По его мнению, любой инструмент (даже перо или клавиатура) может быть использован для написания плохих вещей, но это не повод запрещать технологию .

Кильчер призывает перестать использовать оценочные слова вроде «проблематичный» и перейти к нейтральному обсуждению плюсов и минусов, чтобы технология приносила пользу ученым, особенно тем, для кого английский не является родным языком .

💬 Цитаты

«Мы должны коллективно перестать придавать такое значение капризным обвинениям в «проблематичности» и начать обсуждать технологии в нейтральных терминах.»

Янник Кильчер 10:31

«Ваша предиктивная клавиатура на телефоне тоже опасна и неэтична? А ручка? В петле всегда есть человек, который принимает или отклоняет предсказание.»

Янник Кильчер 6:29
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Hallucination (Галлюцинация)
Феномен, при котором языковая модель уверенно генерирует фактологически неверную информацию.
Tokenization (Токенизация)
Процесс разбиения текста на мелкие части (токены) для обработки нейросетью.
Inference (Инференс)
Этап работы уже обученной модели, когда она выдает ответы на запросы пользователей.
📊 Цифры
🗓 Хронология
  1. Ноябрь 2022 Релиз модели Galactica и запуск публичной демо-версии.
  2. Ноябрь 2022 Meta AI удаляет демо-версию спустя три дня после запуска из-за критики.
⚖️ Другая сторона
Искусственный интеллект Galactica Meta AI Yannic Kilcher LLM Papers with Code