В рамках курса Стэнфордского университета CS329H «Машинное обучение на основе человеческих предпочтений» (Machine Learning from Human Preferences) Колин Мегилл, сооснователь и президент некоммерческого проекта Polis, представил глубокий анализ того, как технологии могут помочь обществу находить точки соприкосновения в условиях крайней поляризации. Основное внимание в лекции было уделено математическим методам выявления консенсуса и рискам, которые несут в себе современные большие языковые модели (LLM).
📊 Что такое Polis: от протестов к государственным технологиям 0:05
Проект Polis зародился в 2012 году как коммерческий стартап, вдохновленный движениями «Occupy Wall Street» и «Арабская весна» . Колин Мегилл вспоминает, что социальные сети того времени (например, Twitter) отлично справлялись с мобилизацией людей, но совершенно не подходили для выработки общих требований или ведения связного диалога . В 2016 году код проекта стал открытым, а в 2019 году организация полностью перешла на некоммерческую модель .
Polis — это система для сбора мнений в масштабе, которую Мегилл называет «эмерджентным опросом» . В отличие от традиционных форумов, здесь нет древовидных веток ответов, что минимизирует токсичность и прямые конфликты.
Механика работы платформы:
- Участники подают краткие утверждения (statements) .
- Другие пользователи голосуют по каждому пункту: «Согласен», «Не согласен» или «Пропускаю» .
- Алгоритм формирует разреженную матрицу данных (sparse matrix), где строки — это участники, а столбцы — утверждения .
- Визуализация использует метод главных компонент (PCA) и кластеризацию методом K-средних (K-means) для разделения людей на группы со схожими взглядами .
На сегодняшний день технология внедрена на национальном уровне в Великобритании, Финляндии, Сингапуре и Тайване .
🛡️ Устойчивость к атакам и «бригадинг» 11:25
Одним из ключевых вопросов обсуждения стала устойчивость системы к манипуляциям. Мегилл привел пример из Тайваня, где решался вопрос о легализации Uber . Тогда компания Uber попыталась повлиять на результат, направив всех своих водителей на платформу для голосования.
По словам Мегилла, Polis обладает естественным иммунитетом к такому «бригадингу» (массовому наплыву ангажированных пользователей):
- Наплыв группы поддержки лишь увеличивает размер одного существующего кластера, но не уничтожает мнения других групп .
- Поскольку алгоритм ищет консенсус между разными кластерами, простое численное превосходство в одной группе не позволяет навязать свою волю всей аудитории .
Однако спикер признает, что появление LLM меняет правила игры. Теперь злоумышленники могут создавать тысячи «синтетических личностей» с разными, детально проработанными профилями мнений, чтобы искусственно создавать новые кластеры . Мегилл считает, что решением может стать интеграция с системами анонимной, но верифицированной идентификации (например, на базе ZK-доказательств или цифровых паспортов) .
🤖 Эксперименты с Anthropic и возможности LLM 22:48
В 2023 году команда Polis совместно с компанией Anthropic опубликовала работу о применении языковых моделей в контексте платформы . Исследователи проверяли, насколько хорошо ИИ (в частности, модель Claude) справляется с задачами модерации, суммаризации мнений и предсказания голосов.
Основные выводы исследования:
- Предсказание голосов: ИИ оказался «пугающе хорош» в прогнозировании того, как проголосует человек по новому утверждению, на основе его предыдущих действий .
- Суммаризация: Модели эффективно объединяют тысячи комментариев в краткие выжимки, сохраняя контекст разных групп .
- Тематическое моделирование: LLM способны выполнять анализ тем прямо «в контексте», что может стать альтернативой классическим статистическим методам .
Мегилл выразил опасение, что государственные институты могут начать «лениво» заменять реальных граждан моделями ИИ для социальных исследований, что приведет к еще большему отчуждению общества от власти .
🏛️ «Машина Хабермаса» и опыт Google DeepMind 36:15
Спикер упомянул недавнее исследование Google DeepMind под названием «ИИ может помочь людям найти общий язык в условиях демократических дискуссий» . Исследователи представили инструмент, который они назвали «машиной Хабермаса» (в честь философа Юргена Хабермаса).
Суть эксперимента DeepMind:
- ИИ помогает группе составить коллективное заявление, которое бы отражало мнение большинства и учитывало интересы меньшинства .
- Результаты показали, что участники эксперимента часто предпочитали формулировки, предложенные ИИ, вариантам, написанным людьми-фасилитаторами .
Мегилл считает это направление крайне перспективным для Polis. В будущем платформа планирует внедрить функционал, где ИИ будет предлагать «консенсусные формулировки», а пользователи смогут оценивать их точность в реальном времени .
🐦 Twitter и Community Notes: Polis в основе глобальной системы 45:49
Малоизвестный факт, но популярная система Community Notes (ранее Birdwatch) в социальной сети X (Twitter) основана на алгоритмических принципах Polis . Сотрудничество началось еще в 2021 году, до покупки компании Илоном Маском .
Отличия реализации в Twitter:
- Вместо кластеризации (K-means) они используют матричную факторизацию в непрерывном пространстве .
- Это было сделано намеренно, чтобы избежать жесткого навешивания ярлыков «либерал» или «консерватор» на пользователей .
- Основная задача алгоритма — найти заметки к твитам, которые посчитают полезными люди с диаметрально противоположными взглядами .
Колин Мегилл иронично отметил, что руководство Twitter изначально позиционировало систему только как борьбу с дезинформацией, не осознавая, что они создали общую систему коллективного разума (hive mind) . Примером послужил случай, когда пользователи коллективно «ответили» вице-президенту Twitter, используя механизм примечаний, чтобы просто поблагодарить его или пошутить .
🏗️ Будущее: выход за рамки алгоритмов 1:02:43
В финальной части дискуссии Мегилл ответил на критику о том, что Polis навязывает структуру обсуждения через фиксированные алгоритмы (PCA/K-means) . Участники дискуссии предположили, что в будущем сам процесс определения кластеров и интерпретации данных должен стать «эмерджентным» — то есть управляемым самими людьми.
Мегилл сообщил о готовящемся обновлении: Polis начнет предоставлять открытый API и пять типов файлов с сырыми данными для каждого обсуждения . Это позволит дата-сайентистам и исследователям применять любые собственные методы анализа и оспаривать выводы стандартных алгоритмов платформы .
Спикер резюмировал, что его «большая мечта» — соединить открытые системы картирования общественных взглядов с государственными подразделениями по инновациям, чтобы масштабировать демократическое участие до уровня миллионов человек .