Может ли искусственный интеллект не просто поддерживать диалог, но и эффективно управлять капиталом на реальном фондовом рынке? В новом выпуске Вес Рот (Wes Roth) анализирует итоги эксперимента Alpha Arena, где ведущие языковые модели (LLM) торговали акциями технологических гигантов с использованием реальных денег, и обсуждает технологию «программного поиска», которая позволила одной из моделей показать впечатляющую доходность.
📊 Эксперимент Alpha Arena: реальные деньги и жесткая конкуренция 0:00
Суть эксперимента Alpha Arena заключается в том, что группе больших языковых моделей выделяется реальный капитал для инвестирования в акции на бирже NASDAQ . Модели покупают и продают ценные бумаги таких компаний, как Tesla, Nvidia, Microsoft, Google, Palantir и Amazon . По словам Веса Рота, в новом сезоне 1.5, который завершился за несколько часов до записи видео, под управлением 32 экземпляров моделей находилось в общей сложности $320 000 реального капитала .
В соревновании участвовали модели от ведущих разработчиков:
Результаты первого сезона (завершился 3 ноября) показали, что большинство моделей немного уступили стратегии «купи и держи» (buy and hold) для биткоина, однако модели Qwen и DeepSeek смогли закончить период с прибылью . В сезоне 1.5 ситуация изменилась: одна «загадочная модель» показала совокупную доходность в 12% за период с 19 ноября по 3 декабря . Вес Рот подчеркивает, что это не симуляция: модели получают данные о новостях и настроениях рынка каждые 6 минут и совершают реальные сделки .
⚠️ Предупреждение о рисках и прозрачности 2:48
Прежде чем углубляться в детали, Вес Рот делает важное предупреждение: когда речь заходит о деньгах и ИИ, всегда существует риск мошенничества. Он отмечает, что история знает примеры, когда люди оказывались в тюрьме за ложь и фрод в подобных схемах . Автор канала подчеркивает, что не рекламирует Alpha Arena, не дает финансовых советов и не знает лично организаторов проекта, хотя и пытается связаться с ними для интервью .
Тем не менее, Вес Рот полагает, что за проектом стоят серьезные исследователи. В частности, он упоминает Джулиана Тогелиуса (Julian Togelius), профессора Нью-Йоркского университета (NYU) и руководителя отдела ИИ в компании N of One, которая курирует Alpha Arena .
🧠 Проблема «зазубренного интеллекта» 11:03
Несмотря на успехи ИИ в прохождении тестов, разработчики Alpha Arena считают, что текущие LLM «карабкаются не на те горы» . По мнению Джулиана Тогелиуса и его коллег, интеллект современных моделей является «зазубренным» (jagged):
- Они с легкостью сдают медицинские экзамены, решают задачи олимпиадного уровня по математике и отлично пишут код .
- Однако их автономность остается хрупкой, а интеллект — нестабильным в реальных условиях.
Вес Рот цитирует Илью Суцкевера, который в одном из подкастов отмечал: современные модели (например, Gemini 3) могли бы считаться полноценным AGI (сильным ИИ) несколько лет назад, но они все еще не могут полноценно заменить человека-работника . Главная причина — сложность реального мира, где решения нужно принимать быстро в условиях двусмысленных вводных данных . Рынок капитала Вес Рот называет «идеальным бенчмарком», потому что его невозможно обмануть или «подогнать» под ответы: это конкурентная среда с нулевой суммой, где для выигрыша одного доллара кто-то другой должен этот доллар потерять .
🧬 Рекурсивное самосовершенствование и модель PROFIT 14:17
Вес Рот раскрывает детали работы «загадочной модели», которая победила в сезоне 1.5. По его мнению, это не стандартная модель вроде Claude 4.5, а специализированный фреймворк под названием PROFIT (Program search for Financial Trading) . В основе этого подхода лежит идея рекурсивного самосовершенствования (Recursive Self-Improvement, RSI).
Механика работы PROFIT, как утверждает автор, напоминает проекты Alpha Evolve от Google DeepMind, Darwin Girdle Machine от Sakana AI и Eureka от NVIDIA :
- Генерация: Модель пишет код на Python, описывающий торговую стратегию .
- Тестирование (Backtesting): Код проверяется на исторических данных рынка .
- Обратная связь: Результаты тестов возвращаются модели с предложением проанализировать слабые места и предложить 2–3 улучшения .
- Эволюция: Создается «дерево поиска», где удачные ветки стратегий продолжают развиваться, а неудачные — «отмирают» .
В системе используются два типа ролей для моделей: «Эксперт-количественный стратег» (разрабатывает подход на естественном языке) и «Количественный разработчик» (пишет исполняемый код) . Согласно данным исследователей, процесс самосовершенствования обычно достигает плато через 15 итераций, а 75% экспериментов приводят к созданию стратегий, которые превосходят подход «купи и держи» .
📈 Результаты по категориям и «Performance Anxiety» 21:46
В соревновании Alpha Arena модели тестировались в разных режимах:
- Baseline (Базовый): PROFIT показал отличные результаты .
- Monk Mode (Режим монаха): Упор на сохранение капитала и выживание. Здесь лидируют DeepSeek и Gemini .
- Situational Awareness (Ситуативная осведомленность): Модели знают свой рейтинг и результаты конкурентов. В этом режиме модель PROFIT значительно опередила всех соперников .
- Max Leverage (Максимальное плечо): Тест на управление рисками при использовании заемных средств. Лидирует OpenAI, PROFIT на втором месте .
Вес Рот в шутку предполагает, что другие модели могли испытать «тревогу из-за необходимости соревноваться» (performance anxiety), когда им сообщили об их текущем рейтинге, что привело к снижению их показателей .
🔮 Будущее трейдинга и ИИ 26:08
По мнению Веса Рота, наиболее важным аспектом является то, что эти системы представляют собой «каркас» (scaffolding), в который можно вставить любую современную LLM . Это как гоночный болид: если заменить пилота на более опытного, результаты вырастут. Если сегодня PROFIT использует условную Gemini 2.5, то с выходом Gemini 3 или GPT-5 система автоматически станет эффективнее .
Автор делает прогноз: в ближайшие пять лет станет ясно, действительно ли такой подход способен генерировать стабильную прибыль на «живых» рынках . Если это подтвердится, мир увидит появление первых людей, «печатающих деньги» с помощью ИИ, прежде чем остальной рынок успеет адаптироваться . Вес Рот призывает зрителей следить за прозрачностью таких проектов, чтобы не стать жертвой очередной финансовой пирамиды, маскирующейся под высокие технологии .