Как алгоритмы Polis и Twitter Community Notes помогают находить консенсус в поляризованном мире

Stanford Online 2,3 тыс. 1 ч 13 мин 4 мин 11.09.2025
Главное

В рамках курса Стэнфордского университета CS329H «Машинное обучение на основе человеческих предпочтений» (Machine Learning from Human Preferences) Колин Мегилл, сооснователь и президент некоммерческого проекта Polis, представил глубокий анализ того, как технологии могут помочь обществу находить точки соприкосновения в условиях крайней поляризации. Основное внимание в лекции было уделено математическим методам выявления консенсуса и рискам, которые несут в себе современные большие языковые модели (LLM).

📊 Что такое Polis: от протестов к государственным технологиям 0:05

Проект Polis зародился в 2012 году как коммерческий стартап, вдохновленный движениями «Occupy Wall Street» и «Арабская весна» . Колин Мегилл вспоминает, что социальные сети того времени (например, Twitter) отлично справлялись с мобилизацией людей, но совершенно не подходили для выработки общих требований или ведения связного диалога . В 2016 году код проекта стал открытым, а в 2019 году организация полностью перешла на некоммерческую модель .

Polis — это система для сбора мнений в масштабе, которую Мегилл называет «эмерджентным опросом» . В отличие от традиционных форумов, здесь нет древовидных веток ответов, что минимизирует токсичность и прямые конфликты.

Механика работы платформы:

На сегодняшний день технология внедрена на национальном уровне в Великобритании, Финляндии, Сингапуре и Тайване .

🛡️ Устойчивость к атакам и «бригадинг» 11:25

Одним из ключевых вопросов обсуждения стала устойчивость системы к манипуляциям. Мегилл привел пример из Тайваня, где решался вопрос о легализации Uber . Тогда компания Uber попыталась повлиять на результат, направив всех своих водителей на платформу для голосования.

По словам Мегилла, Polis обладает естественным иммунитетом к такому «бригадингу» (массовому наплыву ангажированных пользователей):

Однако спикер признает, что появление LLM меняет правила игры. Теперь злоумышленники могут создавать тысячи «синтетических личностей» с разными, детально проработанными профилями мнений, чтобы искусственно создавать новые кластеры . Мегилл считает, что решением может стать интеграция с системами анонимной, но верифицированной идентификации (например, на базе ZK-доказательств или цифровых паспортов) .

🤖 Эксперименты с Anthropic и возможности LLM 22:48

В 2023 году команда Polis совместно с компанией Anthropic опубликовала работу о применении языковых моделей в контексте платформы . Исследователи проверяли, насколько хорошо ИИ (в частности, модель Claude) справляется с задачами модерации, суммаризации мнений и предсказания голосов.

Основные выводы исследования:

  1. Предсказание голосов: ИИ оказался «пугающе хорош» в прогнозировании того, как проголосует человек по новому утверждению, на основе его предыдущих действий .
  2. Суммаризация: Модели эффективно объединяют тысячи комментариев в краткие выжимки, сохраняя контекст разных групп .
  3. Тематическое моделирование: LLM способны выполнять анализ тем прямо «в контексте», что может стать альтернативой классическим статистическим методам .

Мегилл выразил опасение, что государственные институты могут начать «лениво» заменять реальных граждан моделями ИИ для социальных исследований, что приведет к еще большему отчуждению общества от власти .

🏛️ «Машина Хабермаса» и опыт Google DeepMind 36:15

Спикер упомянул недавнее исследование Google DeepMind под названием «ИИ может помочь людям найти общий язык в условиях демократических дискуссий» . Исследователи представили инструмент, который они назвали «машиной Хабермаса» (в честь философа Юргена Хабермаса).

Суть эксперимента DeepMind:

Мегилл считает это направление крайне перспективным для Polis. В будущем платформа планирует внедрить функционал, где ИИ будет предлагать «консенсусные формулировки», а пользователи смогут оценивать их точность в реальном времени .

🐦 Twitter и Community Notes: Polis в основе глобальной системы 45:49

Малоизвестный факт, но популярная система Community Notes (ранее Birdwatch) в социальной сети X (Twitter) основана на алгоритмических принципах Polis . Сотрудничество началось еще в 2021 году, до покупки компании Илоном Маском .

Отличия реализации в Twitter:

Колин Мегилл иронично отметил, что руководство Twitter изначально позиционировало систему только как борьбу с дезинформацией, не осознавая, что они создали общую систему коллективного разума (hive mind) . Примером послужил случай, когда пользователи коллективно «ответили» вице-президенту Twitter, используя механизм примечаний, чтобы просто поблагодарить его или пошутить .

🏗️ Будущее: выход за рамки алгоритмов 1:02:43

В финальной части дискуссии Мегилл ответил на критику о том, что Polis навязывает структуру обсуждения через фиксированные алгоритмы (PCA/K-means) . Участники дискуссии предположили, что в будущем сам процесс определения кластеров и интерпретации данных должен стать «эмерджентным» — то есть управляемым самими людьми.

Мегилл сообщил о готовящемся обновлении: Polis начнет предоставлять открытый API и пять типов файлов с сырыми данными для каждого обсуждения . Это позволит дата-сайентистам и исследователям применять любые собственные методы анализа и оспаривать выводы стандартных алгоритмов платформы .

Спикер резюмировал, что его «большая мечта» — соединить открытые системы картирования общественных взглядов с государственными подразделениями по инновациям, чтобы масштабировать демократическое участие до уровня миллионов человек .

💬 Цитаты

«ИИ оказался пугающе хорош в предсказании голосов участников. Это создает риск того, что институты начнут заменять реальных людей моделями в социальных исследованиях.»

Колин Мегилл 27:32

«Community Notes — это не просто система борьбы с дезинформацией, это система коллективного ответа, настоящий «коллективный разум».»

Колин Мегилл 51:12
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
PCA (Метод главных компонент)
Статистический метод уменьшения размерности данных с потерей наименьшего количества информации.
K-means (Метод K-средних)
Один из самых популярных методов кластеризации данных, разделяющий объекты на группы со схожими характеристиками.
Разреженная матрица (Sparse matrix)
Матрица, в которой большинство элементов равны нулю (в контексте Polis — когда участники проголосовали только по части утверждений).
Матричная факторизация
Метод разложения матрицы на произведение двух или более матриц, часто используемый в рекомендательных системах.
📊 Цифры
🗓 Хронология
  1. 2012 Основание Polis как коммерческого стартапа.
  2. 2016 Открытие исходного кода технологии Polis.
  3. 2019 Трансформация Polis в некоммерческую организацию.
  4. 2021 Начало работы с Twitter над проектом Birdwatch (ныне Community Notes).
  5. 2023 Публикация совместной научной работы с Anthropic об использовании LLM в Polis.
⚖️ Другая сторона
Технологии и IT Polis Colin Megill Anthropic Community Notes K-means