Numerai: Как Ричард Крейб создал «AI-версию Millennium» на базе краудсорсинга и криптографии

Capital Allocators 559 49 мин 4 мин 11.05.2023
Главное

Ричард Крейб (Richard Craib) — основатель Numerai, хедж-фонда нового типа, который использует краудсорсинг и машинное обучение для предсказания движений фондового рынка. В беседе с Тедом Сайдсом (Ted Seides) он объясняет, как объединить анонимных дата-сайентистов со всего мира, криптоэкономические стимулы и теорию количественных финансов для создания «метамодели», способной стабильно генерировать альфу в любых рыночных условиях.

📈 Путь от библиотеки в Кейптауне до хедж-фонда на машинном обучении 2:17

Ричард Крейб начал интересоваться фондовым рынком в восемь лет, когда отец подарил ему первые акции . Будучи подростком в Кейптауне, он бегал в школьную библиотеку сразу после уроков, чтобы успеть к открытию торгов в США и совершать сделки с библиотечных компьютеров . Однако настоящий профессиональный прорыв произошел в 18 лет, когда Крейб осознал, что популярная финансовая литература и телеканалы вроде CNBC — это «информационный фастфуд» . По его мнению, глубокое понимание рынка дает только изучение чистой математики, чем он и занялся в университете.

После выпуска в 2012 году Ричард Крейб попал в индустрию на пике прорывов в области ИИ (беспилотные авто, покупка DeepMind компанией Google) . Его первым местом работы стал квантовый фонд, где он получил карт-бланш на создание модели глобального рынка акций с нуля.

Важные принципы первого опыта Ричарда :

🧠 Концепция Numerai: краудсорсинг интеллекта 10:19

Идея Numerai родилась из наблюдений за платформой Kaggle, где дата-сайентисты со всего мира соревновались в решении сложных задач. Крейб заметил, что внешние специалисты часто «громили» внутренние бенчмарки таких гигантов, как Netflix .

Он решил перенести эту модель в финансы, создав закрытый хедж-фонд с открытым доступом к данным для моделирования.

Основные характеристики системы:

  1. Обфускация данных: Чтобы защитить интеллектуальную собственность и предотвратить копирование сделок, Numerai скрывает названия компаний и значения признаков (features) . Дата-сайентисты видят только столбцы цифр от 0 до 1, но для машинного обучения этого достаточно, чтобы выявить паттерны.
  2. Анонимность и глобальность: Участникам не нужно иметь финансовое образование. Ричард Крейб приводит пример: разработчики Google Translate могут не знать языков, но отлично моделируют данные . Точно так же специалист из NASA может строить лучшие модели для рынка акций в свободное время .
  3. Крипто-стимулы: Numerai выплачивает вознаграждения в собственной криптовалюте NMR. С момента запуска фонд выплатил участникам более 30 миллионов долларов .

⛓️ Механика стекинга и решение проблемы «плохих данных» 18:26

Ключевым нововведением Numerai стал механизм «стекинга» (staking). В первые годы существования проекта Крейб столкнулся с проблемой: модели участников хорошо работали на исторических данных, но «ломались» в реальности (overfitting) .

Чтобы заставить участников отвечать за результат, Numerai ввел правило:

По словам Ричарда Крейба, это создает систему skin in the game (шкура на кону), аналогичную подходу Millennium Management, где каждый управляющий предельно мотивирован не терять деньги . Стекинг отфильтровал случайных людей, оставив только тех, кто уверен в надежности своих алгоритмов.

🤖 Построение портфеля и «Метамодель» 21:19

Numerai не использует присланные данные как готовые торговые советы. Вместо этого компания собирает все прогнозы в единую «Метамодель» .

Процесс выглядит так:

  1. Сбор сигналов: Модели 5500 дата-сайентистов превращаются в длинный вектор прогнозов по 5000 акциям в глобальной вселенной фонда.
  2. Взвешивание по стеку: Чем больше денег участник поставил на свою модель, тем больший вес его прогноз имеет в общем результате .
  3. Оптимизация и риск-менеджмент: Полученный сигнал прогоняется через оптимизатор. Фонд придерживается политики «нейтральности» (factor neutral), убирая риски стран, секторов и классических факторов, таких как моментум или стоимость . Крейб утверждает, что фонд остается рыночно-нейтральным, стараясь генерировать чистую, идиосинкразическую альфу .
  4. Удержание позиций: Несмотря на использование ИИ, фонд торгует медленно. Средний срок владения акциями составляет 3–4 месяца .

🛡️ Устойчивость и будущее AI-фондов 38:18

Ричард Крейб считает, что в периоды рыночного стресса Numerai имеет преимущество. Когда факторы (например, моментум) рушатся, нейтральный фонд этого просто не замечает . В случае низкой доходности «наказываются» в первую очередь не инвесторы, а дата-сайентисты, чьи токены сгорают . Это заставляет сообщество мгновенно адаптироваться и искать новые архитектуры моделей.

Заглядывая вперед, Крейб видит потенциал в использовании больших языковых моделей (LLM) для создания новых факторов (features) на основе новостей и аналитики . Он уверен, что наступает эра «третьего поколения» хедж-фондов, где ИИ является не просто инструментом, а фундаментом всей структуры.

👤 Личные уроки и вызовы 46:52

Самым сложным периодом для Крейба стал 2018 год, когда упал крипторынок, фонда не показывал доходности, а внутри команды начались конфликты . Один из инвесторов даже предложил ему закрыть дело и заняться чем-то другим. Крейб признается, что эта попытка «дать разрешение на уход» его невероятно разозлила и заставила работать еще упорнее .

Главный жизненный урок, который Крейб усвоил как лидер: управление людьми — это самостоятельный навык, который нельзя свести только к математическим формулам .

💬 Цитаты

«Машинное обучение — это путь утверждения, что у нас нет теории или гипотезы, но есть набор данных, на котором можно научиться обобщать будущее.»

Ричард Крейб 08:31

«Наши дата-сайентисты страдают больше, чем инвесторы: если сигналы не работают, их деньги сгорают.»

Ричард Крейб 39:11
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Обфускация данных
Процесс приведения данных к виду, который позволяет проводить вычисления, но скрывает исходные смыслы (например, названия компаний).
Стекинг (Staking)
Блокировка активов в качестве залога для подтверждения достоверности действий или моделей.
Рыночная нейтральность
Стратегия, при которой доходность портфеля не зависит от общего движения рынка за счет баланса длинных и коротких позиций.
Информационный коэффициент (IC)
Показатель мастерства управляющего, измеряющий корреляцию между прогнозами и реальной доходностью.
📊 Цифры
🗓 Хронология
  1. 2012 Ричард Крейб заканчивает обучение и начинает работать квантовым аналитиком.
  2. 2015 Запуск Numerai с привлечением инвестиций от Говарда Моргана.
  3. 2017 Создание собственной криптовалюты NMR и внедрение механизма стекинга.
  4. 2018 Кризисный период: падение токена и сложности в управлении командой.
⚖️ Другая сторона
Экономика и финансы Numerai Ричард Крейб Machine Learning алгоритмическая торговля криптовалюты