Дэнни Халави: «ИИ учится предсказывать будущее на уровне людей»

Искусственный интеллект как пророк: могут ли нейросети предсказывать будущее лучше людей? 0:00

Технологии прогнозирования будущего стремительно развиваются, переходя из области человеческой интуиции в сферу алгоритмических вычислений. Дэнни Халави, аспирант Калифорнийского университета в Беркли, в интервью каналу Eye on AI рассказал о разработке систем, использующих большие языковые модели (LLM) для предсказания геополитических событий и результатов спортивных матчей с точностью, сопоставимой с лучшими человеческими «суперпрогнозистами» и специализированными платформами.

🔮 Сущность суждения: ИИ против рынков предсказаний 6:26

В основе исследований лежит так называемое «суждение» (judgmental forecasting), которое опирается на интуицию, исторические данные и экспертные знания, в отличие от стандартного прогнозирования временных рядов, работающего с обильными структурированными данными.

Ключевым инструментом в этой области являются рынки предсказаний (prediction markets) — платформы, где участники ставят вероятности на исход событий (например, результаты выборов).

Точность таких рынков обусловлена «мудростью толпы»: агрегирование сотен индивидуальных прогнозов позволяет нивелировать когнитивные искажения отдельных людей.
Платформы часто используют механизмы взвешивания: мнения участников, которые успешно предсказывали события в прошлом, имеют больший вес.

По словам Халави, в период до 2022 года точность предсказаний на таких платформах, как Metaculus, Good Judgment Open и CSET-Foretell, достигала 92%. Однако в последние два года точность снизилась до 77%, что гость связывает не с деградацией систем, а с усложнением самих вопросов, на которые приходится отвечать пользователям.

🧠 Архитектура «машинного оракула» 17:23

Команда из Беркли (в составе которой также Фред Зей, Ян Чен и Джейкоб Стайнхарт) разработала сквозную систему на базе языковых моделей, способную автономно собирать данные и формировать прогноз.

Как работает процесс прогнозирования:

Постановка задачи: Система анализирует вопрос и самостоятельно генерирует список подвопросов, охватывающих различные факторы (финансы, геополитику, экономические показатели).
Поиск данных: Используя API новостных агрегаторов (например, Google News или стартап News Catcher), модель находит до 300 релевантных статей.
Фильтрация и суммаризация: Из огромного массива данных модель отбирает наиболее значимые и сжимает их до размеров своего контекстного окна (16 000–32 000 токенов).
Анализ и предсказание: Финальная модель применяет методы «суждения», оценивает надежность источников и формирует финальную вероятность с пояснительным текстом.

Халави подчеркивает, что этот процесс полностью автоматизирован — в нем не участвуют люди. Система обучается на собственных «успешных» прогнозах: если reasoning (логическое обоснование) модели привел к правильному ответу, этот опыт закрепляется в весах системы.

📊 Результаты и перспективы 42:06

На текущем этапе нейросетевая модель достигает точности 71% против 77% у рынков предсказаний. Однако в сегменте событий с высокой степенью неопределенности (вероятность события по мнению рынка от 30% до 70%) система ИИ показывает себя даже лучше, чем «толпа».

Гость объясняет это тем, что модель, прошедшая обучение через RLHF (обучение с подкреплением на основе отзывов людей), склонна к «хэджированию» — она избегает излишне уверенных прогнозов, чтобы минимизировать риск ошибки.

Вызовы и будущее технологии:

Вычислительная мощность: Дальнейшее повышение точности потребует значительно больших ресурсов и более продвинутых архитектур.
Эпистемическая ценность: Прогнозирование может стать инструментом оценки правдивости информации: если источник данных стабильно приводит к неверным прогнозам, модель «обучается» доверять ему меньше.
Интеграция: ИИ не обязательно должен заменить человека; эксперты, использующие языковые модели для исследования, показывают лучшие результаты, чем при работе в одиночку.

Дэнни Халави убежден, что в ближайшие годы крупные компании, такие как OpenAI, будут активно инвестировать в подобные технологии, превращая их в инструмент для принятия информированных решений на уровне корпораций и государственных институтов.