Прогнозы фондового рынка: новый взгляд на интерпретируемое машинное обучение

Автор: Денис Аветисян


Исследователи предлагают инновационный подход к прогнозированию доходности акций, основанный на объединении данных консенсус-прогнозов аналитиков и методов интерпретируемого машинного обучения.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Бесплатный Телеграм канал
Прогнозируемая доходность акций значительно возрастает при использовании обучения на основе консенсуса, достигая пика при значениях $λ$ от 0.3 до 0.4, и оставаясь выше базового уровня даже при $λ = 1.0$, в то время как точность аппроксимации консенсуса аналитиков монотонно увеличивается с ростом значения $λ$.
Прогнозируемая доходность акций значительно возрастает при использовании обучения на основе консенсуса, достигая пика при значениях $λ$ от 0.3 до 0.4, и оставаясь выше базового уровня даже при $λ = 1.0$, в то время как точность аппроксимации консенсуса аналитиков монотонно увеличивается с ростом значения $λ$.

Предложена модель ценообразования активов с концептуальным узким местом (Consensus-Bottleneck Asset Pricing Model), использующая макроэкономические вложения и автокодировщики для повышения точности и интерпретируемости прогнозов.

Несмотря на успехи глубокого обучения в прогнозировании финансовых рынков, интерпретируемость моделей остается серьезной проблемой. В данной работе представлена модель ‘Interpretable Deep Learning for Stock Returns: A Consensus-Bottleneck Asset Pricing Model’, использующая концепцию “узкого места” консенсуса аналитиков для повышения точности и объяснимости прогнозов доходности акций. Модель не только улучшает долгосрочные прогнозы, но и выявляет связь между агрегированием мнений и ожидаемой доходностью, демонстрируя преимущества подхода в отношении традиционных факторных моделей. Сможет ли предложенный фреймворк раскрыть новые закономерности в динамике доходности, обусловленные влиянием коллективных убеждений инвесторов?


Ограничения Традиционного Ценообразования Активов

Традиционные модели ценообразования активов зачастую оказываются неспособными адекватно отразить сложные нюансы рыночных настроений и макроэкономической обстановки, что приводит к неточностям в прогнозировании. Эти модели, основанные на предположениях о рациональности инвесторов и эффективности рынков, часто игнорируют влияние психологических факторов, таких как страх и жадность, а также не учитывают быстро меняющиеся экономические условия, например, внезапные изменения в процентных ставках или геополитические риски. В результате, предсказания, основанные на этих моделях, могут существенно отличаться от реальных рыночных цен, особенно в периоды повышенной волатильности или непредсказуемости. Более того, упрощенные представления о рисках и доходности, используемые в традиционных подходах, могут привести к недооценке или переоценке определенных активов, что, в свою очередь, может исказить инвестиционные решения и привести к убыткам.

Исследования показывают, что опора исключительно на исторические данные при оценке активов становится все более ненадежной в условиях динамично меняющихся рынков и непредсказуемых экономических сдвигов. Традиционные модели, построенные на анализе прошлых тенденций, часто не способны адекватно реагировать на новые факторы, такие как технологические прорывы, геополитические события или изменения в потребительском поведении. Это приводит к систематическим ошибкам в прогнозировании будущей доходности и может существенно искажать инвестиционные решения. Появление «черных лебедей» — редких, но имеющих огромное влияние событий — демонстрирует, что экстраполяция прошлых данных не гарантирует адекватной оценки рисков и возможностей в современных финансовых реалиях. Необходимость интеграции более широкого спектра факторов, включая качественные данные и макроэкономические прогнозы, становится очевидной для повышения точности и надежности моделей ценообразования активов.

Существующие модели ценообразования активов зачастую не учитывают качественные факторы, такие как консенсус-прогнозы аналитиков, что существенно ограничивает их прогностическую способность. Исследования показывают, что игнорирование экспертных оценок и настроений рынка приводит к систематическим ошибкам в предсказании будущей доходности. Аналитики, обладая глубоким пониманием конкретных компаний и отраслей, способны выявлять тенденции и риски, которые остаются незамеченными при использовании исключительно количественных данных. Интеграция качественной информации, выраженной в виде оценок, рекомендаций и прогнозов, позволяет создать более реалистичную и точную модель, способную адаптироваться к меняющимся рыночным условиям и повысить эффективность инвестиционных стратегий. Отсутствие учета субъективных факторов, таким образом, является существенным недостатком традиционных моделей и требует поиска новых подходов к оценке активов.

Отсутствие вложения макроэкономических переменных в автокодировщик приводит к снижению точности прогнозирования годовой доходности акций (слева) и ухудшению аппроксимации консенсус-прогнозов аналитиков (справа).
Отсутствие вложения макроэкономических переменных в автокодировщик приводит к снижению точности прогнозирования годовой доходности акций (слева) и ухудшению аппроксимации консенсус-прогнозов аналитиков (справа).

CB-APM: Подход с Узким Местом Консенсуса

Модель ценообразования активов с учетом консенсуса и узкого места (CB-APM) разработана для одновременного приближения к консенсус-прогнозам аналитиков и предсказания будущей доходности активов. В отличие от традиционных моделей, которые фокусируются исключительно на прогнозировании доходности, CB-APM интегрирует информацию о мнениях экспертов, что позволяет повысить точность прогнозов и обеспечить более полное понимание факторов, влияющих на цены активов. Модель использует данные из различных источников, включая макроэкономические показатели и финансовые отчеты, для формирования прогнозов, которые учитывают как количественные, так и качественные аспекты. Оценка точности CB-APM проводится путем сравнения ее прогнозов с фактической доходностью активов и консенсус-прогнозами аналитиков, что позволяет оценить ее эффективность в качестве инструмента для принятия инвестиционных решений.

Архитектура “Концептуального Узкого Места” (Concept Bottleneck) в модели CB-APM является ключевой инновацией, обеспечивающей интерпретируемость процесса прогнозирования. Данная архитектура вынуждает модель сначала выделять и изучать высокоуровневые, концептуальные признаки из входных данных, прежде чем использовать их для прогнозирования будущей доходности активов. Это достигается за счет создания промежуточного слоя, размерность которого значительно меньше размерности входных данных, что заставляет модель сжимать информацию и концентрироваться на наиболее значимых концепциях. В результате модель не просто выдает прогноз, но и предоставляет возможность анализа того, какие именно концепции оказывают наибольшее влияние на принятое решение, повышая доверие и прозрачность модели.

В модели CB-APM для сжатия многомерных макроэкономических данных используется автокодировщик (Autoencoder), результатом работы которого является представление в виде «Макроэкономических состояний» (Macroeconomic State Embeddings) с пониженной размерностью. Этот процесс позволяет выделить и сохранить наиболее важную контекстную информацию из исходных данных, отфильтровывая шум и избыточность. Автокодировщик обучается реконструировать входные данные, что заставляет его создавать компактное представление, содержащее существенные характеристики макроэкономической ситуации. Полученные «Макроэкономические состояния» служат входными данными для последующего анализа и прогнозирования доходности активов, обеспечивая эффективное представление сложной макроэкономической картины.

Модели CB-APM, использующие консенсусное обучение, значительно превосходят как наивную нейронную сеть, так и стратегию удержания S&P 500, демонстрируя, что учет консенсуса улучшает результаты прогнозирования и доходности портфеля.
Модели CB-APM, использующие консенсусное обучение, значительно превосходят как наивную нейронную сеть, так и стратегию удержания S&P 500, демонстрируя, что учет консенсуса улучшает результаты прогнозирования и доходности портфеля.

Проверка и Метрики Эффективности

Для оценки прогностической силы модели использовалась метрика $R^2$, оценивающая способность модели объяснять дисперсию как доходности, так и приближения к консенсус-прогнозам. В результате тестирования на независимой выборке (out-of-sample) был достигнут пиковый показатель $R^2$ равный 10.46% при значении параметра регуляризации 0.3. Данный показатель отражает долю дисперсии целевых переменных, объясняемую моделью, и служит ключевым индикатором ее эффективности в прогнозировании.

Для обработки пропущенных значений в характеристиках компаний был использован метод «Последнее наблюдение переносится вперед» (Last Observation Carried Forward, LOCF). Данный подход заключается в заполнении пропущенных данных последним доступным значением для соответствующей компании, что позволило обеспечить полноту данных, необходимых для обучения модели. Использование LOCF является стандартной практикой в финансовых моделях и способствует повышению устойчивости модели к неполным данным, минимизируя искажения, которые могли бы возникнуть при исключении наблюдений с пропущенными значениями.

Для оценки эффективности CB-APM было проведено сравнение с базовой моделью — линейной регрессией. Результаты статистического анализа продемонстрировали значимое превосходство CB-APM в точности прогнозирования. Разница в показателях точности является статистически значимой, что указывает на то, что CB-APM обеспечивает более надежные и точные прогнозы по сравнению с линейной регрессией. Данное улучшение подтверждается соответствующими статистическими тестами и значениями $p$-value, указывающими на низкую вероятность случайного получения наблюдаемого результата.

Для оценки практической применимости модели в реальных торговых условиях, в анализ были включены транзакционные издержки. Оценка прибыльности модели проводилась с учетом затрат на совершение сделок, варьирующихся до 75 базисных пунктов. Результаты показали, что коэффициенты Шарпа (Sharpe Ratio) оставались выше единицы даже при максимальных учтенных транзакционных издержках, что указывает на потенциальную прибыльность стратегии после учета расходов на торговлю. Данный результат подтверждает устойчивость модели к реальным рыночным условиям и её пригодность для практического использования.

Оценка R2R² на тестовых данных показывает, что разработанная модель (λ=0.65) демонстрирует более стабильные результаты по сравнению с наивной нейронной сетью (λ=0) при оценке квартальной доходности акций.
Оценка R2R² на тестовых данных показывает, что разработанная модель (λ=0.65) демонстрирует более стабильные результаты по сравнению с наивной нейронной сетью (λ=0) при оценке квартальной доходности акций.

Производительность Портфеля и Более Широкие Последствия

В ходе тестирования предсказаний модели CB-APM посредством стратегии «Длинная-Короткая позиция» было установлено, что она способна генерировать альфа-доход и превосходить традиционные бенчмарки. Применяя данный подход, модель демонстрирует способность выявлять недооцененные и переоцененные активы, позволяя инвесторам формировать портфель с потенциалом получения прибыли, превышающей рыночную. Полученные результаты свидетельствуют о том, что CB-APM предоставляет ценные сигналы для активного управления портфелем, позволяя инвесторам адаптироваться к меняющимся рыночным условиям и максимизировать доходность с учетом риска. Такой подход к формированию портфеля представляет собой перспективную альтернативу пассивным инвестиционным стратегиям.

Оценка эффективности портфеля проводилась с использованием коэффициента Шарпа, который подтвердил способность модели генерировать превосходную доходность с учетом риска. Результаты анализа показали, что максимальное значение коэффициента Шарпа достигло 1.44, что свидетельствует о значительном превосходстве над традиционными бенчмарками и указывает на способность модели обеспечивать высокую доходность при умеренном уровне риска. Данный показатель демонстрирует, что инвестиционная стратегия, основанная на прогнозах модели, позволяет инвесторам получать более высокую доходность на единицу принятого риска, что является ключевым фактором при оценке эффективности инвестиционных стратегий.

Исследование продемонстрировало, что модель CB-APM способна эффективно интерпретировать периоды рецессии, определяемые Национальным бюро экономических исследований (NBER), и учитывать их влияние на ценообразование активов. Анализ показал, что модель не просто фиксирует корреляцию между рецессиями и изменениями цен, но и предоставляет понимание механизмов, посредством которых макроэкономические события влияют на стоимость активов. Это позволяет более точно оценивать риски и потенциальную доходность инвестиций в условиях экономической нестабильности, а также разрабатывать стратегии, адаптированные к конкретным фазам экономического цикла. В частности, CB-APM позволяет выявлять активы, которые наиболее чувствительны к рецессиям, и те, которые демонстрируют устойчивость в периоды экономического спада, предоставляя инвесторам ценные сведения для диверсификации портфеля и управления рисками.

Модель CB-APM представляет собой инновационный подход к оценке активов, объединяя количественные данные с качественным анализом экспертов. В результате интеграции этих двух типов информации, модель демонстрирует повышенную устойчивость и точность прогнозов. В частности, использование консенсуса, сформированного на основе CB-APM, позволило достичь скорректированного $R^2$ в 8.35%, что существенно превосходит показатель в 0.40%, полученный при использовании «сырого» консенсуса аналитиков. Такое улучшение точности имеет значительные последствия для разработки инвестиционных стратегий и управления рисками, позволяя более эффективно оценивать стоимость активов и принимать обоснованные инвестиционные решения.

Проекция латентного пространства автокодировщика, отображающая зависимость от времени года, позволяет выявить корреляцию между состояниями системы и периодами экономических спадов, отмеченными NBER (2001-2004 и 2007-2009).
Проекция латентного пространства автокодировщика, отображающая зависимость от времени года, позволяет выявить корреляцию между состояниями системы и периодами экономических спадов, отмеченными NBER (2001-2004 и 2007-2009).

Представленная работа демонстрирует элегантность подхода к прогнозированию доходности акций посредством модели CB-APM. Акцент на интерпретируемости, достигаемый за счет использования консенсус-узкого места, позволяет не просто предсказывать, но и понимать факторы, влияющие на принятие решений моделью. Это напоминает слова Блеза Паскаля: «Все проблемы человечества происходят от того, что люди не умеют спокойно сидеть в комнате». В контексте данной статьи, ‘комната’ — это сложность финансовых рынков, а ‘спокойное сидение’ — способность модели выявлять ключевые, понятные факторы, влияющие на доходность, вместо того, чтобы быть просто ‘черным ящиком’. Такая прозрачность является признаком глубокого понимания системы и уважения к пользователю, стремящемуся к осмысленным инвестициям.

Куда двигаться дальше?

Представленная работа, безусловно, демонстрирует элегантность подхода — использование консенсусных оценок аналитиков в качестве своеобразного “узкого места” для глубокого обучения. Однако, не стоит обманываться кажущейся простотой. Успех модели, в конечном счете, зависит от качества исходных данных. Вопрос о стабильности и репрезентативности консенсусных оценок, особенно в периоды турбулентности на рынках, остается открытым. Простое улучшение предсказательной силы, без глубокого понимания механизмов, лежащих в основе этих предсказаний, — это все равно что наносить румяна на скелет.

Следующим шагом представляется не просто увеличение объема данных или усложнение архитектуры сети, а углубление понимания взаимосвязи между «узким местом» и фактическими факторами, определяющими доходность активов. Необходимо исследовать, как различные типы экономических “встраиваний” (embeddings) влияют на интерпретируемость модели и её устойчивость к изменениям в макроэкономической среде. Улучшение интерпретируемости — это не просто создание красивых визуализаций, это демонстрация причинно-следственных связей.

И, пожалуй, самое важное — осознание границ применимости данной модели. Финансовые рынки — это не статичная система, и любые предсказательные модели неизбежно устаревают. Поиск универсальной модели, способной предсказывать доходность активов в любых условиях, — это иллюзия. Истинная ценность заключается в создании гибких, адаптивных систем, способных учиться на своих ошибках и приспосабливаться к меняющейся реальности.


Оригинал статьи: https://arxiv.org/pdf/2512.16251.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-19 17:38