ИИ-трейдинг на реальные деньги: как модель PROFIT заработала 12% прибыли за две недели

Wes Roth 20,9 тыс. 27 мин 5 мин 03.12.2025
Главное

Может ли искусственный интеллект не просто поддерживать диалог, но и эффективно управлять капиталом на реальном фондовом рынке? В новом выпуске Вес Рот (Wes Roth) анализирует итоги эксперимента Alpha Arena, где ведущие языковые модели (LLM) торговали акциями технологических гигантов с использованием реальных денег, и обсуждает технологию «программного поиска», которая позволила одной из моделей показать впечатляющую доходность.

📊 Эксперимент Alpha Arena: реальные деньги и жесткая конкуренция 0:00

Суть эксперимента Alpha Arena заключается в том, что группе больших языковых моделей выделяется реальный капитал для инвестирования в акции на бирже NASDAQ . Модели покупают и продают ценные бумаги таких компаний, как Tesla, Nvidia, Microsoft, Google, Palantir и Amazon . По словам Веса Рота, в новом сезоне 1.5, который завершился за несколько часов до записи видео, под управлением 32 экземпляров моделей находилось в общей сложности $320 000 реального капитала .

В соревновании участвовали модели от ведущих разработчиков:

Результаты первого сезона (завершился 3 ноября) показали, что большинство моделей немного уступили стратегии «купи и держи» (buy and hold) для биткоина, однако модели Qwen и DeepSeek смогли закончить период с прибылью . В сезоне 1.5 ситуация изменилась: одна «загадочная модель» показала совокупную доходность в 12% за период с 19 ноября по 3 декабря . Вес Рот подчеркивает, что это не симуляция: модели получают данные о новостях и настроениях рынка каждые 6 минут и совершают реальные сделки .

⚠️ Предупреждение о рисках и прозрачности 2:48

Прежде чем углубляться в детали, Вес Рот делает важное предупреждение: когда речь заходит о деньгах и ИИ, всегда существует риск мошенничества. Он отмечает, что история знает примеры, когда люди оказывались в тюрьме за ложь и фрод в подобных схемах . Автор канала подчеркивает, что не рекламирует Alpha Arena, не дает финансовых советов и не знает лично организаторов проекта, хотя и пытается связаться с ними для интервью .

Тем не менее, Вес Рот полагает, что за проектом стоят серьезные исследователи. В частности, он упоминает Джулиана Тогелиуса (Julian Togelius), профессора Нью-Йоркского университета (NYU) и руководителя отдела ИИ в компании N of One, которая курирует Alpha Arena .

🧠 Проблема «зазубренного интеллекта» 11:03

Несмотря на успехи ИИ в прохождении тестов, разработчики Alpha Arena считают, что текущие LLM «карабкаются не на те горы» . По мнению Джулиана Тогелиуса и его коллег, интеллект современных моделей является «зазубренным» (jagged):

Вес Рот цитирует Илью Суцкевера, который в одном из подкастов отмечал: современные модели (например, Gemini 3) могли бы считаться полноценным AGI (сильным ИИ) несколько лет назад, но они все еще не могут полноценно заменить человека-работника . Главная причина — сложность реального мира, где решения нужно принимать быстро в условиях двусмысленных вводных данных . Рынок капитала Вес Рот называет «идеальным бенчмарком», потому что его невозможно обмануть или «подогнать» под ответы: это конкурентная среда с нулевой суммой, где для выигрыша одного доллара кто-то другой должен этот доллар потерять .

🧬 Рекурсивное самосовершенствование и модель PROFIT 14:17

Вес Рот раскрывает детали работы «загадочной модели», которая победила в сезоне 1.5. По его мнению, это не стандартная модель вроде Claude 4.5, а специализированный фреймворк под названием PROFIT (Program search for Financial Trading) . В основе этого подхода лежит идея рекурсивного самосовершенствования (Recursive Self-Improvement, RSI).

Механика работы PROFIT, как утверждает автор, напоминает проекты Alpha Evolve от Google DeepMind, Darwin Girdle Machine от Sakana AI и Eureka от NVIDIA :

  1. Генерация: Модель пишет код на Python, описывающий торговую стратегию .
  2. Тестирование (Backtesting): Код проверяется на исторических данных рынка .
  3. Обратная связь: Результаты тестов возвращаются модели с предложением проанализировать слабые места и предложить 2–3 улучшения .
  4. Эволюция: Создается «дерево поиска», где удачные ветки стратегий продолжают развиваться, а неудачные — «отмирают» .

В системе используются два типа ролей для моделей: «Эксперт-количественный стратег» (разрабатывает подход на естественном языке) и «Количественный разработчик» (пишет исполняемый код) . Согласно данным исследователей, процесс самосовершенствования обычно достигает плато через 15 итераций, а 75% экспериментов приводят к созданию стратегий, которые превосходят подход «купи и держи» .

📈 Результаты по категориям и «Performance Anxiety» 21:46

В соревновании Alpha Arena модели тестировались в разных режимах:

Вес Рот в шутку предполагает, что другие модели могли испытать «тревогу из-за необходимости соревноваться» (performance anxiety), когда им сообщили об их текущем рейтинге, что привело к снижению их показателей .

🔮 Будущее трейдинга и ИИ 26:08

По мнению Веса Рота, наиболее важным аспектом является то, что эти системы представляют собой «каркас» (scaffolding), в который можно вставить любую современную LLM . Это как гоночный болид: если заменить пилота на более опытного, результаты вырастут. Если сегодня PROFIT использует условную Gemini 2.5, то с выходом Gemini 3 или GPT-5 система автоматически станет эффективнее .

Автор делает прогноз: в ближайшие пять лет станет ясно, действительно ли такой подход способен генерировать стабильную прибыль на «живых» рынках . Если это подтвердится, мир увидит появление первых людей, «печатающих деньги» с помощью ИИ, прежде чем остальной рынок успеет адаптироваться . Вес Рот призывает зрителей следить за прозрачностью таких проектов, чтобы не стать жертвой очередной финансовой пирамиды, маскирующейся под высокие технологии .

💬 Цитаты

«Интеллект языковых моделей зазубрен. Их автономность хрупка, а бремя ложится на наши промпты и ограничения.»

Джулиан Тогелиус 11:16

«Рынки капитала могут быть одним из лучших бенчмарков для ИИ за всю историю.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RSI (Recursive Self-Improvement)
Способность системы искусственного интеллекта самостоятельно улучшать свой собственный программный код или алгоритмы обучения.
Backtesting
Метод тестирования торговой стратегии на исторических данных для оценки её потенциальной эффективности.
Scaffolding (Каркас)
Программная среда, которая направляет работу LLM, проверяет её выводы и обеспечивает выполнение цепочки задач.
Zero-sum environment
Ситуация, в которой выигрыш одного участника в точности равен проигрышу других участников.
📊 Цифры
🗓 Хронология
  1. 3 ноября Завершение первого сезона Alpha Arena по торговле криптовалютами.
  2. 19 ноября Старт сезона 1.5, включающего торговлю акциями США.
  3. 3 декабря Завершение сезона 1.5 и фиксация доходности победившей модели.
⚖️ Другая сторона
Искусственный интеллект Alpha Arena Wes Roth Julian Togelius PROFIT framework Recursive Self-Improvement