Сара Хукер: «Вычислительные пороги ИИ — это ошибочная стратегия»

Machine Learning Street Talk 18,2 тыс. 1 ч 5 мин 2 мин 18.07.2024
Главное

Регулирование ИИ: почему вычислительные пороги — это тупик 2:18

Современные стратегии управления развитием искусственного интеллекта, закрепленные в таких документах, как исполнительный указ правительства США или EU AI Act, опираются на концепцию «вычислительных порогов» (compute thresholds). Суть этой идеи заключается в том, что модели, требующие огромного количества операций с плавающей запятой (FLOPs) при обучении, потенциально несут в себе критические риски, а значит — требуют особого контроля. Однако, как утверждает Сара Хукер, вице-президент по исследованиям Cohere и глава Cohere for AI, попытка свести оценку рисков к одному абсолютному числу FLOPs является фундаментальной ошибкой.

Почему FLOPs — плохой индикатор опасности 8:31

По мнению Хукер, использование единой метрики FLOPs для оценки риска сопряжено с рядом критических проблем:

«Горький урок» и проблема предсказаний 16:41

Дискуссия затрагивает эссе Рича Саттона «Горький урок» (The Bitter Lesson), где утверждается, что общие алгоритмы, опирающиеся на вычислительную мощность, в конечном итоге превосходят любые попытки внедрения рукотворных знаний. Ведущий подкаста и Сара Хукер сходятся во мнении: хотя для моделей с текущей архитектурой (Transformers) масштаб действительно имеет значение, проблема в том, что сообщество исследователей слишком сильно «заблокировано» в рамках одной парадигмы.

По словам Хукер, текущие глубокие нейронные сети крайне неэффективны — они вынуждены «прожевывать» огромные объемы данных, чтобы выучить редкие паттерны, часто запоминая то, что нам в итоге не нужно. В результате, вместо обучения интеллектуальной системе приходится заниматься «разучиванием» (unlearning) и фильтрацией данных, чтобы направить модель в нужное русло.

Альтернатива: активная наследственность и многоцелевая оптимизация 41:45

Для решения проблем, связанных с «длинным хвостом» (редкими, но важными данными, которые современные модели часто игнорируют), Хукер предлагает концепцию активной наследственности (active inheritance). Вместо слепого доверия к одному «учителю» (модели), предлагается:

  1. Выборка данных из различных моделей, ориентированных на разные части задачи.
  2. Использование недифференцируемых целевых показателей (например, уровень сложности текста или педагогическая ценность), которые ранее были недоступны для градиентного спуска.
  3. Отказ от модели «единого порога риска» в пользу систем многоцелевой оптимизации, способных учитывать как глобальные нормы безопасности, так и культурную специфику регионов.

Хукер подчеркивает, что вместо стратегии отказа (refusal), когда модель просто «молчит» в ответ на спорный вопрос, индустрии следует двигаться в сторону предоставления ресурсов и контекстуально обоснованных ответов. Она заключает, что будущее ИИ-безопасности лежит в создании более гибких и прозрачных систем, а не в искусственном ограничении вычислительной мощности.

💬 Цитаты

«Политика вычислительных порогов — это попытка предсказать будущее, но мы в этом очень плохи.»

Сара Хукер 6:12

«Когда цель становится показателем, она перестает быть хорошим показателем.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
FLOPs
Количество операций с плавающей запятой, используемое как грубая мера вычислительной сложности обучения модели.
Длинный хвост (Long tail)
Редкие, низкочастотные данные, которые часто упускаются из виду при обучении моделей на массовых интернет-данных.
RLHF (Reinforcement Learning from Human Feedback)
Метод обучения модели с подкреплением на основе отзывов людей, используемый для её выравнивания с человеческими предпочтениями.
PPO (Proximal Policy Optimization)
Алгоритм обучения с подкреплением, который часто используется в LLM, но является вычислительно дорогим.
DPO (Direct Preference Optimization)
Альтернативный, более простой и офлайновый метод оптимизации моделей на основе предпочтений.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Sarah Hooker Cohere for AI FLOPs AI governance Transformers