Прогнозирование цен акций FTSE100: новый взгляд на графовые нейронные сети

Автор: Денис Аветисян


Исследование представляет инновационный подход к прогнозированию цен акций, основанный на архитектуре графовых нейронных сетей с механизмом внимания.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Бесплатный Телеграм канал
Модель A3TGCN, реализованная в PyTorch, представлена в виде строкового описания, демонстрируя её структуру и взаимосвязи между компонентами.
Модель A3TGCN, реализованная в PyTorch, представлена в виде строкового описания, демонстрируя её структуру и взаимосвязи между компонентами.

В статье рассматривается применение модели A3T-GCN с использованием логарифмической доходности для повышения точности и эффективности прогнозирования финансовых временных рядов.

Прогнозирование цен акций остается сложной задачей, требующей учета как временных, так и пространственных зависимостей. В работе ‘A3T-GCN for FTSE100 Components Price Forecasting’ исследуется новый гибридный подход, основанный на архитектуре A3T-GCN, для прогнозирования цен закрытия акций компаний, входящих в индекс FTSE100. Полученные результаты демонстрируют, что использование годовых логарифмических доходностей в сочетании с более короткими временными рядами позволяет повысить точность прогнозов и снизить вычислительные затраты. Возможно ли дальнейшее улучшение моделей прогнозирования за счет более сложных методов построения графов и интеграции дополнительных финансовых показателей?


Эффективность рынка и границы традиционных моделей

Гипотеза эффективного рынка утверждает, что последовательное превосходство над рынком крайне маловероятно без доступа к непубличной информации, что формирует базовый ориентир для оценки прогностических моделей. Данное положение подразумевает, что цены активов уже отражают всю доступную информацию, делая попытки “обыграть” рынок, основанные исключительно на публичных данных, в большинстве случаев бесплодными. Следовательно, любые модели, претендующие на прогнозирование рыночных изменений, должны демонстрировать способность выявлять и использовать информацию, недоступную широкой публике, или же признавать ограничения своей эффективности. По сути, гипотеза служит не только теоретическим фундаментом, но и практическим критерием оценки: модели, систематически не способные превзойти рыночную доходность с учетом транзакционных издержек, могут быть признаны неэффективными и требующими пересмотра.

Традиционное построение портфелей, базирующееся на теории современного портфеля (Modern Portfolio Theory), широко использует исторические данные для оценки рисков и доходностей активов. Однако, полагаясь на предположения о нормальном распределении и стационарности рыночных процессов, модели могут недооценивать сложность реальных рыночных динамик. Рынки часто демонстрируют асимметрию, избыточную убыточность и кластеризацию волатильности, что отклоняется от нормального распределения. В результате, оптимизированные портфели, основанные на этих упрощенных предположениях, могут оказаться недостаточно устойчивыми к неожиданным событиям и не отражать истинные риски, с которыми сталкиваются инвесторы. Использование исключительно исторических данных также не учитывает возможность изменения рыночных условий и появления новых факторов, влияющих на доходность активов.

Поведение инвесторов, обусловленное налоговыми соображениями, значительно усложняет моделирование финансовых рынков. Традиционные подходы часто игнорируют влияние налогообложения на принятие инвестиционных решений, в то время как инвесторы активно стремятся минимизировать налоговые выплаты, что приводит к таким явлениям, как налоговая потеря продаж и отсрочка реализации прибыли. Данные стратегии оказывают существенное влияние на объемы торгов и цены активов, создавая отклонения от теоретических моделей, предполагающих рациональное поведение. Следовательно, для точной оценки доходности портфеля и прогнозирования рыночных тенденций необходимо разрабатывать модели, учитывающие реальные ограничения, накладываемые налоговым законодательством, и отражающие сложность поведения инвесторов в условиях налоговых стимулов.

Представленные результаты демонстрируют корреляции, основанные как на фундаментальных показателях (верхний график), так и на доходности (нижний график).
Представленные результаты демонстрируют корреляции, основанные как на фундаментальных показателях (верхний график), так и на доходности (нижний график).

Нейронные сети на графах: новый подход к финансоческому прогнозированию

Нейронные сети на графах (GNN) представляют собой перспективный подход к моделированию финансовых данных, превосходящий традиционный анализ временных рядов. В отличие от методов, рассматривающих каждый актив изолированно, GNN позволяют учитывать взаимосвязи между активами, представляя их в виде графа, где акции выступают в роли узлов, а статистические зависимости — в роли ребер. Это позволяет учитывать не только исторические данные конкретного актива, но и влияние сопутствующих активов, что особенно важно для финансовых рынков, характеризующихся высокой степенью взаимосвязанности. Вместо анализа $x_t$ для прогноза $x_{t+1}$, GNN учитывают структуру графа и распространяют информацию между узлами, что позволяет выявлять сложные паттерны и зависимости, невидимые при использовании стандартных методов прогнозирования.

В основе применения графовых нейронных сетей (GNN) в финансовом прогнозировании лежит представление финансовых активов, например акций, в виде узлов графа. Взаимосвязи между этими активами, определяемые такими показателями, как корреляция цен, ковариация или отраслевая принадлежность, моделируются как ребра графа. Это позволяет GNN улавливать сложные зависимости, которые не учитываются традиционными методами анализа временных рядов. Информация о состоянии одного узла (акции) распространяется по графу через ребра, влияя на представления других узлов, что позволяет сети учитывать взаимосвязанность рынков и потенциальное влияние событий на различные активы. Процесс распространения информации, основанный на механизмах агрегации и обновления, позволяет GNN динамически оценивать влияние одних активов на другие и формировать более точные прогнозы.

Архитектура A3T-GCN объединяет возможности графовых конволюционных сетей (GCN), сетей долгой краткосрочной памяти (LSTM) и механизмов внимания для моделирования финансовых временных рядов. GCN используются для агрегации информации от соседних акций в графе, учитывая взаимосвязи между ними. LSTM сети применяются для захвата временных зависимостей в динамике цен каждой акции, обрабатывая последовательности данных. Механизмы внимания позволяют модели динамически определять важность различных акций и временных шагов при прогнозировании, фокусируясь на наиболее релевантной информации. Комбинация этих трех компонентов позволяет A3T-GCN эффективно захватывать как пространственные (взаимосвязи между акциями), так и временные ($t \rightarrow y$) зависимости, повышая точность прогнозирования по сравнению с традиционными методами.

Построение графов для финансовых данных требует количественной оценки взаимосвязей между акциями. Для этого используются методы корреляционного анализа, такие как корреляция Пирсона и корреляция Спирмена, позволяющие определить статистическую зависимость между ценами акций. Корреляция Пирсона ($r$) измеряет линейную зависимость, в то время как корреляция Спирмена оценивает монотонную зависимость. Помимо корреляций, для определения начальных связей в графе применяется классификация по секторам экономики. Акции, принадлежащие к одному сектору, изначально соединяются ребрами, что отражает их потенциальную взаимосвязь, обусловленную общими факторами влияния. Комбинация корреляционных методов и секторальной классификации позволяет создать комплексный граф, учитывающий как статистические зависимости, так и отраслевую принадлежность.

Повышение точности прогнозирования с помощью продвинутых признаков и оценки модели

Годовая логарифмическая доходность ($log(P_t/P_0)$) используется для оценки динамики цен за продолжительный период, что позволяет сгладить краткосрочные колебания и уменьшить влияние рыночного шума. В отличие от простых процентных изменений, логарифмическая доходность обеспечивает более стабильную и надежную оценку, поскольку учитывает сложные процентные ставки и уменьшает влияние выбросов. Применение годовой логарифмической доходности особенно важно при анализе долгосрочных тенденций и построении моделей прогнозирования, где требуется точная и репрезентативная оценка исторических данных.

Интеграция технических индикаторов, таких как RSI (Relative Strength Index) и MACD (Moving Average Convergence Divergence), в архитектуру A3T-GCN направлена на обогащение входных данных модели дополнительными сигналами о динамике рынка. Индикатор RSI позволяет оценить силу и скорость ценовых движений, выявляя перекупленность или перепроданность актива, что может указывать на потенциальные развороты тренда. MACD, в свою очередь, демонстрирует взаимосвязь между двумя скользящими средними цены актива, предоставляя информацию о текущем тренде и возможных изменениях в импульсе. Комбинированное использование этих индикаторов в рамках A3T-GCN позволяет модели более эффективно улавливать краткосрочные и среднесрочные изменения в ценовой динамике, улучшая точность прогнозирования.

Для оценки точности и надежности модели использовались метрики $MSE$ (Mean Squared Error), $MAE$ (Mean Absolute Error) и $RMSE$ (Root Mean Squared Error). В ходе тестирования, модель показала значение $MSE$ равное 0.0036, $RMSE$ — 0.0603, а $MAE$ — 0.0439. Эти показатели позволяют количественно оценить отклонение предсказанных значений от фактических, где более низкие значения указывают на более высокую точность модели.

Архитектура A3T-GCN расширяет возможности сверточных нейронных сетей (CNN) за счет интеграции временной информации и механизмов внимания. В ходе тестирования на выделенной выборке модель достигла средней абсолютной ошибки (MAE) в 3.46% и коэффициента детерминации $R^2$ равного 0.9936105, что свидетельствует о высокой степени соответствия модели данным и, следовательно, о ее надежной прогностической способности. Использование механизмов внимания позволяет модели фокусироваться на наиболее релевантных временных зависимостях в данных, улучшая качество прогнозов по сравнению со стандартными CNN.

Кривая обучения показывает уменьшение средней абсолютной ошибки (MAE) с увеличением числа эпох.
Кривая обучения показывает уменьшение средней абсолютной ошибки (MAE) с увеличением числа эпох.

Влияние и перспективы развития финансового моделирования

Архитектура A3T-GCN демонстрирует повышенную прогностическую точность, что открывает возможности для значительного улучшения стратегий формирования инвестиционного портфеля и управления рисками. В отличие от традиционных моделей, полагающихся на предположение о независимости активов, данная архитектура способна улавливать сложные взаимосвязи между ними, позволяя более адекватно оценивать потенциальные риски и доходность. Это позволяет инвесторам создавать более диверсифицированные и устойчивые портфели, оптимизированные для достижения конкретных финансовых целей. В частности, повышенная точность прогнозирования позволяет более эффективно распределять капитал, своевременно выявлять потенциальные угрозы и оперативно реагировать на изменения рыночной конъюнктуры, минимизируя потери и максимизируя прибыль. Таким образом, A3T-GCN представляет собой перспективный инструмент для профессиональных участников финансового рынка, стремящихся к повышению эффективности своей деятельности.

В отличие от традиционных финансовых моделей, которые часто исходят из предположения о независимости активов, представленный подход позволяет учитывать сложные взаимосвязи между ними. Это достигается благодаря использованию графовых нейронных сетей, способных анализировать не только индивидуальные характеристики активов, но и структуру их взаимодействий. Такой анализ позволяет выявлять скрытые зависимости, которые могут существенно влиять на динамику рынка и, как следствие, повышать точность прогнозирования и эффективность управления рисками. Вместо упрощенного взгляда на активы как на изолированные единицы, данная методология рассматривает финансовый рынок как сложную сеть взаимосвязанных элементов, что обеспечивает более реалистичное и полное представление о его функционировании и позволяет учитывать эффекты распространения информации и каскадные эффекты между активами.

Перспективные исследования должны быть направлены на расширение области применения разработанной архитектуры за пределы текущих финансовых рынков. Очевидным шагом является адаптация модели к анализу товарных рынков, рынкам недвижимости и даже криптовалют, где взаимосвязи между активами могут быть еще более сложными и динамичными. Кроме того, интеграция альтернативных источников данных, таких как новостные потоки, социальные сети и спутниковые изображения, способна значительно повысить точность прогнозов. Анализ тональности новостей, например, может служить индикатором настроений инвесторов, а данные о потребительской активности, полученные из альтернативных источников, способны предвосхищать изменения на рынке. Подобный мультимодальный подход, объединяющий традиционные финансовые данные с неструктурированной информацией, откроет новые возможности для создания более надежных и эффективных финансовых моделей.

Дальнейшее развитие архитектуры A3T-GCN представляется перспективным в направлении интеграции динамических графовых структур и адаптивных алгоритмов обучения. В текущем виде модель оперирует статичным представлением взаимосвязей между финансовыми активами, однако рынки по своей природе изменчивы. Включение динамических графов позволит учитывать эволюцию этих взаимосвязей во времени, отражая изменения в рыночном настроении и экономических условиях. Адаптивные алгоритмы обучения, в свою очередь, обеспечат модели возможность самостоятельно корректировать свои параметры в ответ на новые данные, повышая ее устойчивость к рыночным шокам и непредсказуемым событиям. Такой подход позволит не только улучшить прогностическую точность, но и создать более надежную и гибкую систему для управления финансовыми рисками и оптимизации инвестиционных портфелей. Исследования в этом направлении могут привести к созданию самообучающихся моделей, способных адаптироваться к меняющимся условиям рынка и обеспечивать стабильно высокие результаты.

Исследование демонстрирует, что эффективное прогнозирование финансовых рынков требует не только учета временных рядов, но и анализа взаимосвязей между активами. Авторы предлагают модель A3T-GCN, которая, используя графовые нейронные сети, способна улавливать эти сложные зависимости. Особое внимание уделяется инженерному подходу к признакам, в частности, использованию годовых логарифмических доходов (ALR), которые позволяют повысить точность прогнозов и снизить вычислительные затраты. Как писал Блез Паскаль: «Человек — это тростник, самый слабый в природе, но это тростник, который мыслит». Подобно тому, как модель A3T-GCN анализирует данные для выявления закономерностей, так и человек, используя свой разум, способен преодолеть ограничения и понять сложный мир финансовых рынков.

Куда дальше?

Представленная работа, подобно микроскопу, позволила рассмотреть закономерности в динамике цен акций FTSE100. Однако, стоит признать, что даже самый совершенный инструмент не способен охватить всю сложность финансовой реальности. Успешное применение A3T-GCN и, в частности, выделение признаков годовой логарифмической доходности (ALR), безусловно, снижает вычислительную нагрузку, но не решает проблему нелинейности и хаотичности рыночных процессов. Вопрос о стабильности и обобщающей способности модели в условиях меняющихся макроэкономических факторов остается открытым.

В перспективе, представляется плодотворным исследование возможности интеграции A3T-GCN с другими классами моделей, например, с механизмами обучения с подкреплением, что позволит создать адаптивные системы, способные учитывать долгосрочные тренды и оперативно реагировать на рыночные шоки. Особый интерес представляет разработка методов интерпретации результатов, позволяющих понять, какие факторы оказывают наибольшее влияние на прогнозируемые цены. Ведь модель, подобно черному ящику, раскрывает закономерности, но не объясняет их.

В конечном счете, поиск оптимальной модели прогнозирования — это бесконечный процесс, требующий постоянного анализа, экспериментирования и критической оценки результатов. Подобно исследователю, стремящемуся к истине, необходимо помнить, что каждая найденная закономерность — это лишь приближение к сложной и многогранной финансовой вселенной.


Оригинал статьи: https://arxiv.org/pdf/2511.21873.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-01 18:51