Гордон Ирлам: почему «правило 4%» проигрывает машинному обучению

Rational Reminder 5 тыс. 47 мин 9 мин 02.09.2021
Главное

В выпуске подкаста Rational Reminder под номером 165 ведущие Бенджамин Феликс и Кэмерон Пэссмор обсуждают современные подходы к управлению финансами и выходу на пенсию с уникальным экспертом. Гордон Ирлам, бывший ранний сотрудник компании Google, успешный предприниматель и независимый исследователь, делится тем, как применение машинного обучения кардинально меняет классические экономические модели. В центре дискуссии — интеграция концепций эффективного альтруизма в управление капиталом и превосходство передовых алгоритмов над традиционными финансовыми правилами.

💰 Капитал Google и продажа Postini: дилемма диверсификации 3:04

После того как компания Google провела первичное публичное размещение акций (IPO), Гордон Ирлам принял решение полностью диверсифицировать свой портфель. Как вспоминает сам гость, он строго следовал рекомендациям классических финансовых консультантов и продавал корпоративные акции сразу по мере их вестинга. С чисто финансовой точки зрения Ирлам признает, что этот шаг сопровождался определенными эмоциональными трудностями: если бы он сохранил эти ценные бумаги, их стоимость сегодня составляла бы от 10 до 20 миллионов долларов.

Тем не менее исследователь убежден, что совершил абсолютно рациональный поступок, поскольку в тот период никто не мог предугадать будущее компании, и Google вполне мог повторить судьбу Yahoo. Сегодня гость дает аналогичный совет современным сотрудникам технологических гигантов: по его мнению, необходимо избегать чрезмерной концентрации капитала в акциях одного работодателя.

Дальнейшая карьера Ирлама привела к еще одному крупному финансовому событию. Компания Postini, которую он основал до прихода в Google, впоследствии была выкуплена поисковым гигантом за 625 миллионов долларов наличными. По словам Ирлама, этот значительный приток ликвидности не изменил его повседневную жизнь радикально, так как его накопления и ранее покрывали большинство жизненных потребностей.

Однако сделка обеспечила ему высокий уровень психологического комфорта и безопасности, полностью избавив от необходимости ежедневно следить за колебаниями фондового рынка. Главным ограничением богатства Ирлам называет фактор времени: по его мнению, деньги способны снизить жизненные риски, но они бессильны перед тем фактом, что с возрастом у человека остается все меньше времени и возможностей для реализации масштабных проектов.

🌍 Эффективный альтруизм: математический подход к благотворительности 7:14

Полученный от продажи компании Postini капитал позволил Ирламу основать собственный благотворительный фонд, деятельность которого строится на принципах движения эффективного альтруизма. Гость поясняет, что миссия его организации формулируется как «достижение наибольшего ожидаемого блага». В отличие от традиционных фондов, которые, как утверждает исследователь, часто распределяют гранты на основе эмоциональных предпочтений или личного опыта учредителей, эффективный альтруизм требует строгого прагматизма и оценки отдачи от инвестиций, аналогично бизнес-метрикам.

В качестве примера Ирлам приводит дистрибуцию противомалярийных сеток в развивающихся странах. Сторонники эффективного альтруизма скрупулезно рассчитывают стоимость одной сетки, математическую вероятность того, что она предотвратит конкретный случай заражения малярией, и сопоставляют это со статистической стоимостью человеческой жизни. На основе таких вычислений ученые могут заявить, что каждый доллар, вложенный в противомалярийные сетки, приносит, условно, десять долларов чистого социального возврата инвестиций.

В рамках своей аналитической деятельности Ирлам создал специализированный веб-ресурс под названием «Back of the Envelope Guide to Philanthropy». На основе собственных расчетов исследователь выделяет три ключевых направления с наивысшим потенциалом полезности:

📈 Управление фондами: почему благотворительный капитал требует риска 11:58

Важный аспект работы Ирлама посвящен распределению активов (asset allocation) внутри эндаументов и донорских фондов (DAF). Эксперт придерживается мнения, что благотворительный капитал должен инвестироваться гораздо более агрессивно, чем средства, предназначенные для личного потребления. Логика Ирлама строится на асимметрии последствий: если фонд теряет часть стоимости из-за падения рынка, социальный ущерб для конечных бенефициаров оказывается менее чувствительным, чем финансовый удар по частному инвестору.

Падение фондового индекса в два раза напрямую снижает уровень жизни состоятельного американца, но практически не влияет на выживание жителя Африки, существующего на два доллара в день и имеющего другие нерыночные источники жизнеобеспечения. На практике Ирлам применяет холистический подход к управлению финансами. Он объединяет личные сбережения и средства благотворительного фонда в единый консолидированный пул активов, для которого рассчитывается общая траектория оптимизации. Лишь на финальном этапе, при формировании ежегодного бюджета, система определяет, какая доля расходов будет профинансирована за счет благотворительного фонда, а какая — из личных средств.

При этом Ирлам указывает на нерешенную экономическую проблему — определение благотворительной ставки дисконтирования (charitable discount rate). Этот параметр должен отвечать на вопрос, принесет ли один доллар, потраченный сегодня, больше пользы, чем доллар, инвестированный для трат в будущем.

По признанию гостя, точные математические модели здесь буксуют из-за колоссальной неопределенности исходных данных, поэтому в рамках своего фонда он директивно установил такую ставку, которая позволит полностью распределить благотворительные активы в течение его жизни. С точки зрения структуры портфеля, Ирлам считает теоретически оправданным максимальное использование компенсируемых рисков, включая смещение в сторону акций малой капитализации и стоимости (small-cap value tilt), однако предупреждает о жестких регуляторных ограничениях на уровень риска для официальных фондов.

📉 Экономический подход против практического: полезность потребления и стохастическое программирование 18:22

Разделение между подходами практикующих финансовых планировщиков и академических экономистов носит фундаментальный характер. Как объясняет Ирлам, традиционные консультанты фокусируются преимущественно на максимизации номинального богатства и чистой стоимости активов (net worth) клиента. В то же время экономический подход оперирует понятием функции полезности потребления (utility of consumption), исследуя, какую реальную пользу приносит каждый потраченный доллар.

Зависимость полезности от объема расходов не является линейной и имеет свойство насыщения. Ирлам иллюстрирует это простым примером: если годовые расходы человека удваиваются со 100 тысяч до 200 тысяч долларов, субъективная полезность и удовлетворение не возрастают в два раза, а увеличиваются, к примеру, лишь в полтора раза. Скорость, с которой кривая полезности уплощается, в экономической науке называют коэффициентом относительного неприятия риска (relative risk aversion).

Для нахождения идеального баланса между накоплением и тратами экономисты исторически использовали метод стохастического динамического программирования (stochastic dynamic programming). Алгоритм работает посредством обратного отсчета во времени:

  1. Моделируется гипотетический предельный возраст инвестора (например, 100 лет), в котором оптимальная стратегия очевидна — потратить все оставшиеся деньги.
  2. Программа делает шаг назад к возрасту 99 лет и рассчитывает наилучшие действия с учетом стохастической неопределенности рыночной доходности на основе данных из моделируемого будущего.
  3. Процесс повторяется для 98, 97 лет и так далее, выстраивая динамическую траекторию для каждого года жизни.

По мнению Ирлама, этот метод превосходит классические статичные планы, поскольку диктует гибкое изменение структуры потребления в ответ на реальные рыночные шоки.

🤖 Обучение с подкреплением: новая эра в пенсионном планировании 22:58

Несмотря на математическую строгость стохастического динамического программирования, Ирлам принял решение отказаться от него в пользу алгоритмов машинного обучения, а именно — обучения с подкреплением (reinforcement learning). Первоначальный инструмент исследователя gcalc успешно функционировал на базе динамического программирования, но имел серьезные вычислительные ограничения. Главный недостаток старого метода заключается в так называемом «проклятии размерности»: расчет становится экспоненциально дорогим при добавлении дополнительных переменных состояния (state variables). К таким переменным Ирлам относит налоговую базу инвестиций или текущую стоимость аннуитетных контрактов.

В отличие от динамического программирования, выдающего точное математическое решение, обучение с подкреплением действует методом симуляций. Алгоритм прогоняет миллионы и миллиарды симулированных инвестиционных лет, тестируя различные паттерны поведения и фиксируя, какие из них ведут к росту долгосрочной полезности. Модель обучается двигаться строго вперед во времени, что значительно упрощает программирование сложных налоговых и юридических систем.

Переход на рельсы машинного обучения подтвердил ряд гипотез Ирлама. В частности, алгоритм выявил высокую ценность длинных облигаций с индексацией на инфляцию (inflation-indexed bonds). По словам гостя, обычные финансовые консультанты считают эти инструменты рискованными из-за высокой волатильности, вызванной длительным сроком погашения. Однако с точки зрения долгосрочной экономической перспективы покупка 30-летних инфляционных облигаций представляет собой идеальное хеджирование, буквально фиксирующее реальную покупательную способность будущего пенсионного потребления.

🛡️ Облигации, аннуитеты и неэффективность «правила четырех процентов» 26:17

Результаты компьютерного моделирования методом обучения с подкреплением наглядно продемонстрировали несостоятельность классических правил финансового планирования. Ирлам провел детальный сравнительный анализ и обнаружил, что во всех рассмотренных сценариях машинное обучение превзошло традиционные эвристические подходы на величину от 6% до 32%. Этот прирост эффективности фиксировался по метрике потребления, эквивалентного определенности (certainty equivalent consumption) — стабильного уровня расходов, который имеет для инвестора ту же ценность, что и волатильная, изменчивая траектория реальных трат. Стоит отметить, что сравнение проводилось после тщательной ручной настройки параметров традиционных правил под оптимальные значения.

В качестве примера Ирлам критикует знаменитое «правило четырех процентов», подразумевающее ежегодное изъятие фиксированной суммы с поправкой на инфляцию. По мнению исследователя, стратегия неизменного потребления в корне неоптимальна, поскольку пытается навязать статичную модель динамически меняющейся рыночной реальности. Оптимальный путь, рассчитанный нейросетью, предполагает, что инвестор обязан ежегодно корректировать как объемы трат, так и долю акций и облигаций в портфеле.

Отдельное внимание в моделях Ирлама уделено немедленным аннуитетам с единой премией (SPIA). Данный инструмент существенно повышает совокупное благосостояние пенсионера, выступая аналогом безрисковой облигационной части портфеля. Однако Ирлам обнаружил рыночную неэффективность в ценообразовании аннуитетов: страховые компании используют агрегированные таблицы смертности, объединяя в один пул клиентов, купивших полис много лет назад и имеющих ухудшившееся здоровье, с абсолютно здоровыми новыми покупателями. Из-за этого математически более выгодной стратегией является откладывание покупки аннуитета до достижения возраста 70–80 лет. Обучение с подкреплением дает здесь несколько размытый ответ, поскольку точный тайминг не оказывает критического влияния на итоговый результат.

📊 Тактическое распределение активов и будущее портфельной теории 36:47

Созданный Ирламом общедоступный онлайн-инструмент ai planner позволяет пользователям активировать функцию тактического распределения активов (tactical asset allocation). Преимущество тактического подхода над стратегическим базируется на двух китах: кластеризации волатильности (volatility clustering) и возврате к среднему (mean reversion) в доходностях акций. На практике это означает, что в периоды экстремальной рыночной турбулентности алгоритм рекомендует временно снижать долю акций, и наоборот.

При этом сам Ирлам высказывает скепсис относительно надежности феномена возврата к среднему, заявляя, что не уверен в его стабильном существовании на 95-процентном уровне значимости. Тем не менее для математического моделирования он использует консервативную оценку: каждые 10% условной «переоцененности» фондового рынка снижают ожидаемую будущую доходность на 1%. Корректировка портфеля в модели происходит раз в год, что сглаживает краткосрочные шумы, но опускает транзакционные издержки и налоговые обязательства, которые в реальном мире могут существенно снизить выгоду от частых ребалансировок.

Подводя итог многолетним исследованиям, Ирлам формулирует главные тезисы для частных инвесторов:

Гость резюмирует, что его публикация 2020 года в Journal of Retirement стала первым принципиально новым подходом к классической портфельной проблеме за последние полвека. В будущем, по мере роста вычислительных мощностей, Ирлам прогнозирует переход от генерации обобщенных моделей (нынешний ai planner обучается на базе 2 миллиардов симулированных лет финансовых рынков) к персонализированному обучению нейросетей под уникальные параметры каждого конкретного человека.

💬 Цитаты

«Постоянное расходование средств — это попытка применить фиксированную, статичную модель к динамической, постоянно меняющейся ситуации.»

Гордон Ирлам 33:13

«Я определяю успех как наличие достаточных ресурсов для того, чтобы иметь возможность работать над проблемами, которые являются одновременно интересными и важными.»

Гордон Ирлам 47:18
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Полезность потребления
Экономическая мера удовлетворения или пользы, которую инвестор получает от расходования денежных средств.
Стохастическое динамическое программирование
Математический метод оптимизации многоэтапных решений в условиях неопределенности путем обратного отсчета времени.
Обучение с подкреплением
Метод машинного обучения, при котором алгоритм оптимизирует стратегию поведения, совершая миллионы пробных симуляций и получая вознаграждение.
Потребление, эквивалентное определенности
Стабильный уровень расходов, который приносит инвестору ту же полезность, что и переменная, зависящая от рыночных колебаний траектория трат.
Аннуитет SPIA
Страховой контракт с единовременной выплатой премии, который гарантирует клиенту пожизненные регулярные фиксированные выплаты.
📊 Цифры
⚖️ Другая сторона
Экономика и финансы Гордон Ирлам Rational Reminder reinforcement learning stochastic dynamic programming