Сара Хукер: «Пороги вычислений в законах об ИИ бессмысленны»

Machine Learning Street Talk 18,2 тыс. 1 ч 5 мин 9 мин 18.07.2024
Главное

В новом выпуске подкаста Machine Learning Street Talk ведущий Тим Скарфе обсуждает с вице-президентом по исследованиям в Cohere Сарой Хукер фундаментальные проблемы регулирования и развития искусственного интеллекта. Главной темой беседы стал критический анализ современных регуляторных подходов, таких как фиксированные пороги вычислительной мощности в законах США и ЕС, а также технологические барьеры в создании многоязычных моделей. Собеседники подробно разбирают, почему простая гонка за масштабом вычислений упирается в архитектурные тупики и усугубляет глобальное цифровое неравенство.

⚖️ Пороги вычислительной мощности: иллюзия контроля в законах об ИИ 2:05

В основе недавней аналитической статьи Сары Хукер лежит критический разбор концепции «порогов вычислительной мощности» (compute thresholds), которая легла в основу ключевых мировых нормативных актов в сфере ИИ. Этот подход предполагает, что модели, достигшие определенного масштаба в будущем, задекларируют совершенно иной профиль рисков и потребуют особого надзора со стороны государства. В исполнительном указе президента США этот порог был установлен на уровне $10^{26}$ FLOPS, в то время как Европейский союз в своем Законе об ИИ (EU AI Act) решил проявить большую строгость и опустил планку до $10^{25}$ FLOPS. Метрика FLOPS представляет собой простой подсчет всех математических операций — сложения, вычитания и в особенности умножения матриц, доминирующих в современных сетях, — выполненных в процессе обучения.

По словам Хукер, регуляторы отдают предпочтение метрике FLOPS по нескольким прагматичным причинам:

Тем не менее Хукер считает такой подход глубоко ошибочным. Главная проблема заключается в том, что эти нормативные акты ориентированы исключительно на будущее и никак не затрагивают реальные риски, существующие в дикой природе прямо сейчас. Порог был установлен примерно на уровне возможностей модели GPT-4, хотя официального научного обоснования этому выбору со стороны правительств предоставлено не было.

💸 Закон Гудхарта и обход регуляторных ограничений 11:04

Тим Скарфе отметил, что введение жесткого числового лимита неизбежно сталкивается с действием закона Гудхарта: когда показатель становится целью, он перестает быть хорошим показателем. Скарфе привел аналогию с банковской системой, где установление лимита на транзакции в размере $10 000 провоцирует появление огромного количества операций на сумму $9 999 ради обхода контроля.

Хукер соглашается с этой оценкой и утверждает, что отслеживание FLOPS на протяжении жизненного цикла модели превратится в неразрешимую задачу для государств. На рынке сложилась практика, когда пользователи скачивают базовые модели с платформы Hugging Face и осуществляют их дообучение (continued pre-training), наслаивая собственные методы оптимизации. В таких условиях невозможно точно установить совокупный объем вычислений, который был вложен в итоговые веса нейросети. Ситуация усложняется архитектурными решениями:

В качестве альтернативы Хукер предлагает отказаться от статических точек перегиба и перейти к динамической оценке рисков. Она приводит аналогию с агентом по недвижимости, который оценивает стоимость дома не по абсолютному шаблону, а на основе перцентиля и контекста окружающих предложений в районе. Регулирование должно быть гибким, привязанным к конкретным классам моделей (например, биологическим или мультимодальным) и оценивать риски динамически. Если правительства намерены сохранить вычисления в качестве метрики, им жизненно необходимо дополнить её вспомогательными индексами реального вреда.

📉 Оптимизация на этапе вывода против «Горького урока» Саттона 12:13

Серьезным аргументом против жесткой привязки к FLOPS при обучении является бурное развитие методов пост-тренинговой оптимизации. Сюда относятся обучение с подкреплением (RLHF), инструктивный тюнинг, дистилляция синтетических данных и оптимизация на этапе вывода (inference time optimization). Например, метод выборки лучших из N вариантов (best-of-N sampling) позволяет значительно поднять качество ответов за счет вычислительных мощностей на этапе генерации. Применение этих техник способно сделать модель в 2–6 раз мощнее без изменения объема FLOPS, затраченного на её базовое обучение, что полностью игнорируется текущим законодательством.

Собеседники подробно обсудили знаменитое эссе Рича Саттона «Горький урок» (The Bitter Lesson), утверждавшее, что любые попытки заложить в ИИ человеческие экспертные знания исторически проигрывали простому масштабированию вычислений. Хукер считает это эссе великолепным, но требующим важного уточнения. Масштабирование вычислений действительно эффективно в рамках конкретной неизменной архитектуры (например, трансформеров), поскольку глубокие сети являются «жадными учениками» и счетчиками частот, улучшающими показатели на редких паттернах из «длинного хвоста» данных.

Однако Хукер подчеркивает, что именно алгоритм задает предел насыщения и скорость, с которой вычисления трансформируются в полезные навыки. В качестве примера она привела историю развития технологий:

Таким образом, наши законы масштабирования и способность прогнозировать будущее ограничены рамками текущей узкой архитектурной парадигмы.

🧠 Алгоритмический тупик градиентного спуска 21:35

Обсуждая то, что можно назвать «алгоритмической лотереей», Хукер указала на фундаментальные ограничения современного подхода к обучению машин. Вся индустрия оказалась заперта в рамках градиентной оптимизации, работающей исключительно с дифференцируемыми целевыми функциями. Это заставляет системы выполнять глобальные обновления весов на основе усреднения колоссальных объемов данных. У этого подхода есть два критических изъяна:

Хукер противопоставляет этому человеческий мозг, обладающий разделением на долговременную и кратковременную память с разной скоростью обучения. Человек способен изолированно хранить воспоминания детства и события сегодняшнего дня, тогда как алгоритмы ИИ из-за отсутствия альтернативных архитектурных решений вынуждены оставаться в рамках неэффективных глобальных градиентных обновлений.

🌐 Языковой разрыв в ИИ и «проклятие многоязычности» 30:29

Важнейшим направлением работы Сары Хукер является исследование проблемы, описанной в её статье «The AI Language Gap». Исторически сложилось так, что ключевые исследовательские хабы ИИ сосредоточены в США, Лондоне и Китае, поэтому создатели моделей переобучили их под свои собственные высокочастотные паттерны — в первую очередь под английский язык. Из 7000 языков, существующих на планете, около 80% вообще не имеют текстового корпуса в вебе, что превращает их интеграцию в ИИ в мультимодальную задачу. Даже среди топ-101 языков мира практически нет моделей, способных адекватно работать с ними.

Статистика интернета резко искажает реальную картину человечества: английский язык является родным лишь для 5% населения Земли, но занимает более 50% всего интернет-пространства. В то же время язык йоруба, на котором говорят 40 миллионов человек, практически не представлен в сети. Ситуация усугубляется наступлением эры синтетических данных:

Существует и выраженное техническое смещение (optimization bias) на уровне токенизаторов. Латинские шрифты обрабатываются эффективно, но когда дело доходит до хинди или корейского языка, токенизаторы работают крайне плохо. Это накладывает на пользователей за пределами англоязычного мира «двойной налог»: для кодирования одного и того же смысла требуется значительно больше токенов, что автоматически увеличивает задержку (latency) и стоимость использования API.

В рамках проекта Aya исследовательская лаборатория Cohere for AI создала модель, поддерживающую 101 язык (включая такие редкие, как валлийский, гаитянский и телугу). Из-за дефицита качественных мультиязычных данных ученым пришлось использовать базовую модель 13B параметров образца 2019 года и компенсировать ограничения за счет экстремальной очистки данных и генерации синтетических инструкций.

🎭 Диалекты, культура и мифы об «эмерджентных свойствах» 36:27

Тим Скарфе сослался на книгу «The Language Game», отметив, что человеческое познание всегда ситуативно и намертво привязано к локальной культуре, что противоречит идее создания единого абстрактного разума. Хукер подтвердила это, поделившись внутренней историей разработки Aya. При оценке качества португальского языка возник жесткий конфликт между аннотаторами: бразильские участники проекта физически численно превосходили коллег из Португалии и постоянно исправляли их тексты под свои языковые нормы, игнорируя нюансы португальского языка Лиссабона или Мозамбика.

Хукер также подвергла критике мифологизацию масштабирования, когда феномен улучшения работы моделей называют «эмерджентными (внезапно возникающими) свойствами». Изначально мультиязычность приводилась в статьях как пример такого чуда, но последующие исследования доказали: эти свойства присутствовали в данных изначально, просто не были должным образом задокументированы. Масштаб — это не магия, а просто постепенное освоение моделью низкочастотных данных из «длинного хвоста» распределения. Создание искусственного мифа о «непостижимых» свойствах масштаба используется лишь для нагнетания общественной тревоги и паники, что Хукер считает в корне неверным фреймингом.

🛡️ Безопасность ИИ против ответственного ИИ: битва за терминологию 33:51

Хукер выразила открытое недовольство тем, как в индустрии произошел контролируемый семантический сдвиг от термина «ответственный ИИ» (Responsible AI) к «безопасности ИИ» (AI Safety). По её мнению, это было сделано намеренно определенными группами из Кремниевой долины, которые хотели дистанцироваться от повседневной этики и сместить фокус на абстрактные экзистенциальные риски (X-risk). Она требует вернуть разговорам точность, поскольку за размытым словом «safety» часто скрывается полное отсутствие подотчетности за конкретные результаты.

Нынешний подход к выравниванию (alignment) моделей страдает избыточным упрощением и сводится к примитивным бинарным отказам (refusals). Модели на всякий случай блокируют любые медицинские вопросы о сексуальном здоровье, хотя статьи на той же Википедии по этой теме абсолютно легальны и полезны. Хукер предлагает:

Полное искоренение галлюцинаций невозможно и вредно, так как именно этот механизм отвечает за креативность и генерацию нестандартных идей, которые ценят люди.

🏎️ Назад к основам: оптимизация RLHF и преодоление артефактов перевода 58:36

В своей новой работе «Back to Basics» команда Хукер переосмыслила классические методы обучения с подкреплением. Популярный алгоритм PPO (Proximal Policy Optimization) пришел в языковые модели из традиционного робототехнического RL, где ошибки склонны лавинообразно накапливаться в огромных шумных пространствах поиска. Из-за этого PPO чрезвычайно требователен к памяти, заставляя держать в работе до четырех тяжелых моделей одновременно. Однако в LLM после этапа предварительного обучения пространство поиска вариантов следующего токена уже жестко сконцентрировано и предобусловлено. Применение громоздкого PPO в таких условиях было явным избыточным решением (overkill).

Разработчики доказали, что можно убрать большинство компонентов PPO и использовать значительно более легкий онлайн-метод ReLU (вероятно, RLOO), который превосходит по эффективности даже популярный офлайн-метод DPO.

Этот облегченный подход лег в основу исследования «RL Speaks Many Languages», где ученые решали проблему «артефактов перевода». Традиционно при нехватке данных разработчики просто переводят качественные английские датасеты на целевые языки с помощью машинного перевода, из-за чего модели перенимают неестественные конструкции — например, вместо цифр начинают писать слова прописью. Для борьбы с этим команда Сары Хукер применила изящное решение:

💬 Цитаты

«Порог вычислений не основан на текущих рисках в реальном мире; это политика, ориентированная исключительно на будущее.»

Сара Хукер 07:24

«Когда показатель становится целью, он перестает быть хорошим показателем.»

Тим Скарфе 15:12

«Токенизаторы накладывают «двойной налог» на нелатинские шрифты: это более высокая задержка и стоимость.»

Сара Хукер 46:37
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
FLOPS
Внесистемная единица, используемая для оценки производительности вычислительных систем и подсчета математических операций при обучении ИИ.
Закон Гудхарта
Экономическое правило, гласящее, что любой экономический или технологический показатель теряет свою ценность, как только становится главной целью регулирования.
Токенизатор
Алгоритм разбиения входного сырого текста на смысловые фрагменты (токены), понятные нейросети.
PPO
Популярный алгоритм обучения с подкреплением, накладывающий строгие ограничения на шаг обновления политики нейросети во избежание деградации.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Cohere for AI US AI Act модели ИИ многоязычные модели