Искусственный интеллект как пророк: могут ли нейросети предсказывать будущее лучше людей? 0:00
Технологии прогнозирования будущего стремительно развиваются, переходя из области человеческой интуиции в сферу алгоритмических вычислений. Дэнни Халави, аспирант Калифорнийского университета в Беркли, в интервью каналу Eye on AI рассказал о разработке систем, использующих большие языковые модели (LLM) для предсказания геополитических событий и результатов спортивных матчей с точностью, сопоставимой с лучшими человеческими «суперпрогнозистами» и специализированными платформами.
🔮 Сущность суждения: ИИ против рынков предсказаний 6:26
В основе исследований лежит так называемое «суждение» (judgmental forecasting), которое опирается на интуицию, исторические данные и экспертные знания, в отличие от стандартного прогнозирования временных рядов, работающего с обильными структурированными данными.
Ключевым инструментом в этой области являются рынки предсказаний (prediction markets) — платформы, где участники ставят вероятности на исход событий (например, результаты выборов).
- Точность таких рынков обусловлена «мудростью толпы»: агрегирование сотен индивидуальных прогнозов позволяет нивелировать когнитивные искажения отдельных людей.
- Платформы часто используют механизмы взвешивания: мнения участников, которые успешно предсказывали события в прошлом, имеют больший вес.
По словам Халави, в период до 2022 года точность предсказаний на таких платформах, как Metaculus, Good Judgment Open и CSET-Foretell, достигала 92%. Однако в последние два года точность снизилась до 77%, что гость связывает не с деградацией систем, а с усложнением самих вопросов, на которые приходится отвечать пользователям.
🧠 Архитектура «машинного оракула» 17:23
Команда из Беркли (в составе которой также Фред Зей, Ян Чен и Джейкоб Стайнхарт) разработала сквозную систему на базе языковых моделей, способную автономно собирать данные и формировать прогноз.
Как работает процесс прогнозирования:
- Постановка задачи: Система анализирует вопрос и самостоятельно генерирует список подвопросов, охватывающих различные факторы (финансы, геополитику, экономические показатели).
- Поиск данных: Используя API новостных агрегаторов (например, Google News или стартап News Catcher), модель находит до 300 релевантных статей.
- Фильтрация и суммаризация: Из огромного массива данных модель отбирает наиболее значимые и сжимает их до размеров своего контекстного окна (16 000–32 000 токенов).
- Анализ и предсказание: Финальная модель применяет методы «суждения», оценивает надежность источников и формирует финальную вероятность с пояснительным текстом.
Халави подчеркивает, что этот процесс полностью автоматизирован — в нем не участвуют люди. Система обучается на собственных «успешных» прогнозах: если reasoning (логическое обоснование) модели привел к правильному ответу, этот опыт закрепляется в весах системы.
📊 Результаты и перспективы 42:06
На текущем этапе нейросетевая модель достигает точности 71% против 77% у рынков предсказаний. Однако в сегменте событий с высокой степенью неопределенности (вероятность события по мнению рынка от 30% до 70%) система ИИ показывает себя даже лучше, чем «толпа».
Гость объясняет это тем, что модель, прошедшая обучение через RLHF (обучение с подкреплением на основе отзывов людей), склонна к «хэджированию» — она избегает излишне уверенных прогнозов, чтобы минимизировать риск ошибки.
Вызовы и будущее технологии:
- Вычислительная мощность: Дальнейшее повышение точности потребует значительно больших ресурсов и более продвинутых архитектур.
- Эпистемическая ценность: Прогнозирование может стать инструментом оценки правдивости информации: если источник данных стабильно приводит к неверным прогнозам, модель «обучается» доверять ему меньше.
- Интеграция: ИИ не обязательно должен заменить человека; эксперты, использующие языковые модели для исследования, показывают лучшие результаты, чем при работе в одиночку.
Дэнни Халави убежден, что в ближайшие годы крупные компании, такие как OpenAI, будут активно инвестировать в подобные технологии, превращая их в инструмент для принятия информированных решений на уровне корпораций и государственных институтов.