Как Allen Institute for AI открывает «черный ящик» LLM с помощью проекта OLMo

The TWIML AI Podcast with Sam Charrington 2,8 тыс. 36 мин 7 мин 04.03.2024
Главное

Современная индустрия искусственного интеллекта переживает кризис воспроизводимости: большинство передовых больших языковых моделей (LLM) разрабатываются за закрытыми дверями технологических гигантов. В ответ на эту тенденцию некоммерческий Институт искусственного интеллекта Аллена (AI2) представил OLMo — полностью открытую инициативу, призванную вернуть научную строгость и прозрачность в сферу глубокого обучения. Старший инженер-исследователь AI2 Акшита Бхагия рассказывает, как создание открытой экосистемы из обучающих данных, кода, логов и промежуточных весов меняет подход к созданию ИИ и с какими неожиданными трудностями сталкиваются разработчики при масштабировании моделей.

🚀 Философия OLMo: почему закрытые ИИ-модели тормозят науку 2:01

Проект OLMo (Open Language Model) зародился в начале 2023 года . Главным стимулом для его запуска стало то, что подавляющее большинство коммерческих и даже номинально открытых моделей на рынке скрывают детали своего обучения . Разработчики либо предоставляют доступ к технологиям исключительно через API, либо публикуют веса моделей без раскрытия состава обучающей выборки и конфигурационных файлов.

По мнению Акшиты Бхагии, отсутствие прозрачности делает невозможным полноценное научное исследование ИИ . Ученые не могут понять, почему модель ведёт себя определённым образом, как на её выводы влияют те или иные обучающие тексты и где проходят границы её когнитивных возможностей. Кроме того, закрытость процессов приводит к колоссальным финансовым потерям в масштабах всей индустрии: десятки научных групп параллельно тратят миллионы долларов на одни и те же вычислительные эксперименты , повторно совершая одни и те же ошибки и «изобретая велосипед» .

Вместо выпуска очередной изолированной модели команда AI2 создала полноценную открытую экосистему. В неё входят:

На момент публикации материалов проекта инженерами были подготовлены версии моделей OLMo на 1 млрд (1B) и 7 млрд (7B) параметров . На этапе обучения находится флагманская модель масштабом 65 млрд (65B) параметров .

По мнению Акшиты Бхагии, цель проекта состоит не в том, чтобы занять первую строчку в каком-либо бенчмарке на две недели . Команда стремится дать исследователям фундамент для совместной работы. Если другая научная группа возьмет наработки OLMo и сделает модель еще лучше — это будет победой для всего мирового сообщества .

📊 Дольма: 3 триллиона токенов под строгим контролем 6:40

Ключевым дифференциатором OLMo на фоне таких моделей, как Llama 2, является полная открытость обучающей выборки . Инженеры AI2 представили проект Dolma (шутливая расшифровка — Data to feed OLMo’s appetite, «Данные для утоления аппетита OLMo») . Это гигантский датасет объемом около 3 триллионов токенов , а также открытый одноименный инструментарий (Dolma Toolkit) для его фильтрации и курирования .

Для построения выборки исследователи сознательно выбирали только общедоступные источники информации, чтобы избежать юридических рисков и обеспечить максимальную прозрачность . В состав Dolma вошли:

Очистка данных проходила в несколько этапов. На первом шаге применялся языковой фильтр, поскольку Dolma ориентирована преимущественно на английский язык и языки программирования . На втором этапе производилась фильтрация качества по базовым эвристикам — например, из датасета исключались документы, состоящие из одной повторяющейся гласной буквы . Третий этап включал удаление персональных данных (PII) и фильтрацию токсичного контента .

Особое внимание команда уделила борьбе с контаминацией данных . С помощью внутреннего проекта AI2 под названием What’s in my Big Data разработчики проверяли обучающую выборку на предмет утечки в неё тестовых вопросов из популярных бенчмарков . Если тесты попадают в обучение, модель демонстрирует отличные результаты на бумаге, но теряет объективность при реальном тестировании .

Акшита Бхагия подчёркивает, что знание точного состава обучающих данных критически важно для коммерческого использования моделей . Бизнес должен понимать, видела ли модель во время обучения политические новости, медицинские карты или специфический технический сленг, чтобы прогнозировать её поведение в реальных продуктах .

🛠 Инженерные ловушки: непредсказуемый PyTorch и проблемы с весами 15:32

Процесс обучения крупной языковой модели всегда сопряжен с техническими трудностями, которые редко попадают на страницы академических публикаций. Инженеры AI2 столкнулись со множеством скрытых факторов, влияние которых невозможно было просчитать заранее из-за ограничений вычислительного бюджета на проведение предварительных тестов (абляций) .

Одной из главных архитектурных проблем при переходе от масштаба в 1 млрд параметров к 7 млрд стала нестабильность функции потерь . При обучении OLMo 1B хорошо себя показал метод связывания весов (weight tying), при котором эмбеддинги входного и выходного слоёв используют общую матрицу параметров . Однако на модели масштабом 7B этот подход начал вызывать регулярные скачки лосса и нестабильность обучения .

Кроме того, разработчики столкнулись с проблемами при использовании параметрической нормализации слоёв (parametric layer norm) . В отличие от авторов большинства аналогичных LLM, инженерам OLMo пришлось отказаться от этого подхода в пользу непараметрической нормализации слоёв .

Самым ярким и неожиданным препятствием в процессе обучения стал баг в генераторе случайных чисел популярной библиотеки PyTorch . На ранних этапах обучения инженеры зафиксировали странные периодические аномалии на графиках сходимости модели . Исследователи две недели вели ожесточенные споры об архитектуре нейросети, подозревая ошибки в конфигурации гиперпараметров .

В итоге выяснилось, что стандартная функция генерации случайных чисел в PyTorch (torch.random) выдает некорректные, недостаточно случайные перестановки при перемешивании обучающих последовательностей . Этот случай, по мнению Бхагии, наглядно демонстрирует пользу публикации подробных инженерных отчетов: такие «невидимые» проблемы часто замалчиваются командами разработчиков, вынуждая другие лаборатории тратить недели на их повторное обнаружение .

⚖️ Paloma: новая методология оценки ИИ на 600 микродоменах 23:26

Оценка возможностей современных моделей — еще одна проблемная зона ИИ-индустрии. Традиционные бенчмарки (такие как Helm или AlpacaEval) чаще всего формулируют задачи в виде ранговой классификации или генерации ответов на вопросы . Однако точность модели в таких тестах сильно зависит от формулировки промпта . Изменение пары слов в вопросе может драматически снизить или повысить показатели системы .

Для решения этой проблемы исследователь Иэн Магнусон из команды AI2 возглавил разработку Paloma — специализированного бенчмарка для оценки перплексии моделей (Perplexity Analysis for Language Model Assessment) . Перплексия измеряет, насколько хорошо модель предсказывает распределение символов или слов в конкретном тексте .

Paloma предлагает комплексную оценку на основе:

Такой подход позволяет уйти от усредненных оценок. Акшита Бхагия объясняет, что общая перплексия модели на терабайтах интернет-текста может улучшаться по мере её масштабирования, но это не гарантирует равномерного прогресса во всех областях . Модель может прекрасно генерировать посты для социальных сетей благодаря обилию разговорной речи в выборке, но при этом деградировать в понимании медицинской литературы или юридических документов .

Бенчмарк Paloma позволяет исследователям точечно оценивать готовность модели к работе в узкоспециализированных сферах. Например, ученые в области цифровых гуманитарных наук (digital humanities) могут проверить, насколько хорошо OLMo ориентируется в детективных романах XIX века и способна ли она корректно воспринимать описанное там насилие .

🛡 Безопасность открытого кода и взгляд в будущее 31:46

В индустрии не утихают дискуссии об опасности бесконтрольного распространения весов мощных нейросетей. Оппоненты открытого подхода утверждают, что злоумышленники могут переобучить публичные модели для создания спам-ботов, генерации пропаганды или планирования кибератак.

Акшита Бхагия категорически не согласна с идеей о том, что закрытость систем гарантирует безопасность . По мнению исследовательницы, если архитектура и обучающие данные модели скрыты от общественности, независимые эксперты не могут провести аудит её уязвимостей . Без понимания того, как модель обучалась, невозможно выстроить надежные внешние фильтры и защитные барьеры . Открытая дискуссия и публикация всех этапов создания ИИ — единственный путь к формированию по-настоящему безопасных и этичных технологий .

В планах развития проекта OLMo:

В AI2 подчеркивают, что институт не ставит перед собой задачу конкурировать со всеми коммерческими лабораториями во всех возможных направлениях . Главная миссия OLMo — передать эстафету сообществу разработчиков, обеспечив их фундаментальными инструментами для дальнейших открытий .

💬 Цитаты

«Закрытость не обязательно означает безопасность. Не имея информации о том, как построены эти модели, чрезвычайно сложно создать для них эффективные ограничения.»

Акшита Бхагия 00:00

«Наша цель — совместная разработка более качественных моделей, а не пребывание на вершине таблицы лидеров в течение двух недель.»

Акшита Бхагия 05:59

«Мы застряли на одном эксперименте на две недели, обсуждая архитектурные решения, а виной всему оказался генератор случайных чисел в PyTorch.»

Акшита Бхагия 19:19
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
OLMo
Семейство полностью открытых языковых моделей и сопутствующего инструментария от Allen Institute for AI.
Связывание весов (Weight tying)
Метод в глубоком обучении, при котором эмбеддинги на входе и выходе модели делят общую матрицу весов.
Перплексия (Perplexity)
Метрика оценки языковых моделей, измеряющая степень неопределенности при предсказании следующего токена.
Контаминация данных
Ситуация, при которой тестовые задания из бенчмарков случайно попадают в обучающую выборку модели, искажая результаты оценки.
Параметрическая нормализация слоев (Parametric layer norm)
Вариант нормализации слоев нейросети, содержащий обучаемые параметры сдвига и масштабирования.
📊 Цифры
🗓 Хронология
  1. 2015 Акшита Бхагия окончила университет по специальности «Информационные и коммуникационные технологии» и начала работать в финансовой сфере.
  2. Начало 2023 Запуск проекта OLMo в Allen Institute for AI.
  3. Начало 2024 Релиз моделей OLMo масштабом 1B и 7B вместе с датасетом Dolma и бенчмарком Paloma.
⚖️ Другая сторона
Искусственный интеллект OLMo Allen Institute for AI Акшита Бхагия Dolma Paloma