Дэнни Халави: «ИИ учится предсказывать будущее на уровне людей»

Eye on AI 936 54 мин 3 мин 04.08.2024
Главное

Искусственный интеллект как пророк: могут ли нейросети предсказывать будущее лучше людей? 0:00

Технологии прогнозирования будущего стремительно развиваются, переходя из области человеческой интуиции в сферу алгоритмических вычислений. Дэнни Халави, аспирант Калифорнийского университета в Беркли, в интервью каналу Eye on AI рассказал о разработке систем, использующих большие языковые модели (LLM) для предсказания геополитических событий и результатов спортивных матчей с точностью, сопоставимой с лучшими человеческими «суперпрогнозистами» и специализированными платформами.

🔮 Сущность суждения: ИИ против рынков предсказаний 6:26

В основе исследований лежит так называемое «суждение» (judgmental forecasting), которое опирается на интуицию, исторические данные и экспертные знания, в отличие от стандартного прогнозирования временных рядов, работающего с обильными структурированными данными.

Ключевым инструментом в этой области являются рынки предсказаний (prediction markets) — платформы, где участники ставят вероятности на исход событий (например, результаты выборов).

По словам Халави, в период до 2022 года точность предсказаний на таких платформах, как Metaculus, Good Judgment Open и CSET-Foretell, достигала 92%. Однако в последние два года точность снизилась до 77%, что гость связывает не с деградацией систем, а с усложнением самих вопросов, на которые приходится отвечать пользователям.

🧠 Архитектура «машинного оракула» 17:23

Команда из Беркли (в составе которой также Фред Зей, Ян Чен и Джейкоб Стайнхарт) разработала сквозную систему на базе языковых моделей, способную автономно собирать данные и формировать прогноз.

Как работает процесс прогнозирования:

  1. Постановка задачи: Система анализирует вопрос и самостоятельно генерирует список подвопросов, охватывающих различные факторы (финансы, геополитику, экономические показатели).
  2. Поиск данных: Используя API новостных агрегаторов (например, Google News или стартап News Catcher), модель находит до 300 релевантных статей.
  3. Фильтрация и суммаризация: Из огромного массива данных модель отбирает наиболее значимые и сжимает их до размеров своего контекстного окна (16 000–32 000 токенов).
  4. Анализ и предсказание: Финальная модель применяет методы «суждения», оценивает надежность источников и формирует финальную вероятность с пояснительным текстом.

Халави подчеркивает, что этот процесс полностью автоматизирован — в нем не участвуют люди. Система обучается на собственных «успешных» прогнозах: если reasoning (логическое обоснование) модели привел к правильному ответу, этот опыт закрепляется в весах системы.

📊 Результаты и перспективы 42:06

На текущем этапе нейросетевая модель достигает точности 71% против 77% у рынков предсказаний. Однако в сегменте событий с высокой степенью неопределенности (вероятность события по мнению рынка от 30% до 70%) система ИИ показывает себя даже лучше, чем «толпа».

Гость объясняет это тем, что модель, прошедшая обучение через RLHF (обучение с подкреплением на основе отзывов людей), склонна к «хэджированию» — она избегает излишне уверенных прогнозов, чтобы минимизировать риск ошибки.

Вызовы и будущее технологии:

Дэнни Халави убежден, что в ближайшие годы крупные компании, такие как OpenAI, будут активно инвестировать в подобные технологии, превращая их в инструмент для принятия информированных решений на уровне корпораций и государственных институтов.

💬 Цитаты

«Мы выпустили статью, показывающую, что сквозная система языковой модели может прогнозировать будущие события почти на уровне человеческих совокупных прогнозов.»

Дэнни Халави 0:00

«Система ИИ обучается на этих рассуждениях, потому что мы обнаружили, что они эффективны для принятия правильных прогнозов.»

Дэнни Халави 0:26

«Рынки предсказаний — это очень ценный инструмент, и их успех обусловлен тем, что вы можете получить более точный прогноз, усреднив мнения всех.»

Дэнни Халави 9:59

«Я не думаю, что люди были оптимистичны относительно того, что ИИ способен на это, но учитывая возможности и размер этих моделей, я думаю, это станет возможным в ближайшем будущем.»

Дэнни Халави 35:16
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Judgmental forecasting
Прогнозирование будущего на основе экспертных оценок, интуиции и вероятностей, а не только статистических моделей.
Рынки предсказаний
Платформы, где участники ставят на вероятность наступления тех или иных событий.
RLHF
Метод дообучения моделей на основе обратной связи от людей для повышения точности и безопасности ответов.
Контекстное окно
Объем информации, который нейросеть может обработать за один раз.
Мудрость толпы
Эффект, при котором коллективный прогноз группы людей оказывается точнее, чем прогноз любого отдельного эксперта.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Large Language Models Danny Halawi Prediction Markets Judgmental Forecasting UC Berkeley