Как алгоритмы Polis и Twitter Community Notes помогают находить консенсус в поляризованном мире

В рамках курса Стэнфордского университета CS329H «Машинное обучение на основе человеческих предпочтений» (Machine Learning from Human Preferences) Колин Мегилл, сооснователь и президент некоммерческого проекта Polis, представил глубокий анализ того, как технологии могут помочь обществу находить точки соприкосновения в условиях крайней поляризации. Основное внимание в лекции было уделено математическим методам выявления консенсуса и рискам, которые несут в себе современные большие языковые модели (LLM).

📊 Что такое Polis: от протестов к государственным технологиям 0:05

Проект Polis зародился в 2012 году как коммерческий стартап, вдохновленный движениями «Occupy Wall Street» и «Арабская весна» . Колин Мегилл вспоминает, что социальные сети того времени (например, Twitter) отлично справлялись с мобилизацией людей, но совершенно не подходили для выработки общих требований или ведения связного диалога . В 2016 году код проекта стал открытым, а в 2019 году организация полностью перешла на некоммерческую модель .

Polis — это система для сбора мнений в масштабе, которую Мегилл называет «эмерджентным опросом» . В отличие от традиционных форумов, здесь нет древовидных веток ответов, что минимизирует токсичность и прямые конфликты.

Механика работы платформы:

Участники подают краткие утверждения (statements) .
Другие пользователи голосуют по каждому пункту: «Согласен», «Не согласен» или «Пропускаю» .
Алгоритм формирует разреженную матрицу данных (sparse matrix), где строки — это участники, а столбцы — утверждения .
Визуализация использует метод главных компонент (PCA) и кластеризацию методом K-средних (K-means) для разделения людей на группы со схожими взглядами .

На сегодняшний день технология внедрена на национальном уровне в Великобритании, Финляндии, Сингапуре и Тайване .

🛡️ Устойчивость к атакам и «бригадинг» 11:25

Одним из ключевых вопросов обсуждения стала устойчивость системы к манипуляциям. Мегилл привел пример из Тайваня, где решался вопрос о легализации Uber . Тогда компания Uber попыталась повлиять на результат, направив всех своих водителей на платформу для голосования.

По словам Мегилла, Polis обладает естественным иммунитетом к такому «бригадингу» (массовому наплыву ангажированных пользователей):

Наплыв группы поддержки лишь увеличивает размер одного существующего кластера, но не уничтожает мнения других групп .
Поскольку алгоритм ищет консенсус между разными кластерами, простое численное превосходство в одной группе не позволяет навязать свою волю всей аудитории .

Однако спикер признает, что появление LLM меняет правила игры. Теперь злоумышленники могут создавать тысячи «синтетических личностей» с разными, детально проработанными профилями мнений, чтобы искусственно создавать новые кластеры . Мегилл считает, что решением может стать интеграция с системами анонимной, но верифицированной идентификации (например, на базе ZK-доказательств или цифровых паспортов) .

🤖 Эксперименты с Anthropic и возможности LLM 22:48

В 2023 году команда Polis совместно с компанией Anthropic опубликовала работу о применении языковых моделей в контексте платформы . Исследователи проверяли, насколько хорошо ИИ (в частности, модель Claude) справляется с задачами модерации, суммаризации мнений и предсказания голосов.

Основные выводы исследования:

Предсказание голосов: ИИ оказался «пугающе хорош» в прогнозировании того, как проголосует человек по новому утверждению, на основе его предыдущих действий .
Суммаризация: Модели эффективно объединяют тысячи комментариев в краткие выжимки, сохраняя контекст разных групп .
Тематическое моделирование: LLM способны выполнять анализ тем прямо «в контексте», что может стать альтернативой классическим статистическим методам .

Мегилл выразил опасение, что государственные институты могут начать «лениво» заменять реальных граждан моделями ИИ для социальных исследований, что приведет к еще большему отчуждению общества от власти .

🏛️ «Машина Хабермаса» и опыт Google DeepMind 36:15

Спикер упомянул недавнее исследование Google DeepMind под названием «ИИ может помочь людям найти общий язык в условиях демократических дискуссий» . Исследователи представили инструмент, который они назвали «машиной Хабермаса» (в честь философа Юргена Хабермаса).

Суть эксперимента DeepMind:

ИИ помогает группе составить коллективное заявление, которое бы отражало мнение большинства и учитывало интересы меньшинства .
Результаты показали, что участники эксперимента часто предпочитали формулировки, предложенные ИИ, вариантам, написанным людьми-фасилитаторами .

Мегилл считает это направление крайне перспективным для Polis. В будущем платформа планирует внедрить функционал, где ИИ будет предлагать «консенсусные формулировки», а пользователи смогут оценивать их точность в реальном времени .

🐦 Twitter и Community Notes: Polis в основе глобальной системы 45:49

Малоизвестный факт, но популярная система Community Notes (ранее Birdwatch) в социальной сети X (Twitter) основана на алгоритмических принципах Polis . Сотрудничество началось еще в 2021 году, до покупки компании Илоном Маском .

Отличия реализации в Twitter:

Вместо кластеризации (K-means) они используют матричную факторизацию в непрерывном пространстве .
Это было сделано намеренно, чтобы избежать жесткого навешивания ярлыков «либерал» или «консерватор» на пользователей .
Основная задача алгоритма — найти заметки к твитам, которые посчитают полезными люди с диаметрально противоположными взглядами .

Колин Мегилл иронично отметил, что руководство Twitter изначально позиционировало систему только как борьбу с дезинформацией, не осознавая, что они создали общую систему коллективного разума (hive mind) . Примером послужил случай, когда пользователи коллективно «ответили» вице-президенту Twitter, используя механизм примечаний, чтобы просто поблагодарить его или пошутить .

🏗️ Будущее: выход за рамки алгоритмов 1:02:43

В финальной части дискуссии Мегилл ответил на критику о том, что Polis навязывает структуру обсуждения через фиксированные алгоритмы (PCA/K-means) . Участники дискуссии предположили, что в будущем сам процесс определения кластеров и интерпретации данных должен стать «эмерджентным» — то есть управляемым самими людьми.

Мегилл сообщил о готовящемся обновлении: Polis начнет предоставлять открытый API и пять типов файлов с сырыми данными для каждого обсуждения . Это позволит дата-сайентистам и исследователям применять любые собственные методы анализа и оспаривать выводы стандартных алгоритмов платформы .

Спикер резюмировал, что его «большая мечта» — соединить открытые системы картирования общественных взглядов с государственными подразделениями по инновациям, чтобы масштабировать демократическое участие до уровня миллионов человек .