Глубокое обучение на службе финансов: новый взгляд на прогнозирование рынков

Автор: Денис Аветисян

Исследование представляет собой масштабный сравнительный анализ современных архитектур глубокого обучения для предсказания финансовых временных рядов.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

Изменение волатильности на 10% позволило сравнить производительность различных моделей по скорректированной валовой прибыли и убыткам, выявив различия в их эффективности при колебаниях рынка.

Оценка эффективности рекуррентных и state space моделей при оптимизации коэффициента Шарпа для построения портфелей.

Несмотря на растущий интерес к применению глубокого обучения в финансовом анализе, систематической оценки различных архитектур с акцентом на оптимизацию коэффициента Шарпа до настоящего времени не проводилось. В работе ‘Deep Learning for Financial Time Series: A Large-Scale Benchmark of Risk-Adjusted Performance’ представлен масштабный сравнительный анализ современных моделей глубокого обучения для прогнозирования финансовых временных рядов и определения оптимального размера позиции. Полученные результаты демонстрируют, что рекуррентные и state space модели стабильно превосходят линейные и основанные на attention подходы при оптимизации коэффициента Шарпа, а гибридные модели, такие как VSN с LSTM, показывают наилучшие результаты. Какие дальнейшие исследования необходимы для разработки еще более эффективных моделей глубокого обучения для прогнозирования финансовых рынков и управления рисками?

Неуловимость Финансовых Рынков: Вызов для Традиционных Моделей

Традиционные статистические методы, такие как авторегрессионные модели $AR(p)$ , часто оказываются недостаточно эффективными при анализе финансовых временных рядов. Основная сложность заключается в их неспособности адекватно учитывать присущую финансовым данным нестационарность — тенденцию к изменению статистических свойств во времени. В отличие от многих других типов данных, финансовые ряды редко демонстрируют стабильное среднее значение и дисперсию, что приводит к систематическим ошибкам в прогнозах, построенных на основе упрощенных предположений о стационарности. Более того, финансовые данные подвержены влиянию множества факторов, включая рыночные настроения, геополитические события и макроэкономические показатели, что создает сложные зависимости и нелинейности, которые трудно уловить с помощью линейных моделей, таких как традиционные $AR$ модели. В результате, при попытке прогнозировать динамику финансовых инструментов, использование исключительно авторегрессионного подхода может приводить к значительным погрешностям и неточным оценкам рисков.

Точное прогнозирование финансовых инструментов имеет первостепенное значение для эффективного управления рисками и оптимизации инвестиционного портфеля. Неспособность предвидеть будущие колебания цен может привести к значительным финансовым потерям, поэтому финансовые институты и инвесторы постоянно стремятся к разработке и внедрению более сложных методов прогнозирования. Эти методы должны учитывать не только исторические данные, но и различные факторы, влияющие на рынок, такие как макроэкономические показатели, политические события и настроения инвесторов. В результате, растет потребность в алгоритмах, способных выявлять сложные зависимости в данных и адаптироваться к постоянно меняющимся рыночным условиям, что стимулирует развитие новых подходов в области машинного обучения и анализа временных рядов.

Финансовые временные ряды характеризуются высокой степенью непредсказуемости и значительным уровнем шума, что обуславливает необходимость использования моделей, способных улавливать сложные взаимосвязи и адаптироваться к меняющимся рыночным условиям. Традиционные статистические методы зачастую оказываются неэффективными в обработке таких данных, поскольку финансовые рынки демонстрируют нестационарность и подвержены влиянию множества факторов, не всегда поддающихся линейному анализу. Поэтому, современные исследования направлены на разработку алгоритмов, способных выявлять нелинейные зависимости, учитывать долгосрочную память и быстро реагировать на изменения в динамике цен, что критически важно для точного прогнозирования и эффективного управления рисками. Успешная адаптация к постоянно меняющимся условиям требует от моделей не только способности к обучению на исторических данных, но и к непрерывному совершенствованию в режиме реального времени.

Процесс оптимизации портфеля включает извлечение статистических и технических индикаторов из исторических цен, использование их в качестве входных данных для модели, преобразование выходных данных модели в веса портфеля с помощью линейной проекции и гиперболической функции активации, а также обучение модели путем минимизации отрицательного коэффициента Шарпа <span class="katex-eq" data-katex-display="false"> \frac{\mu - r}{\sigma} </span>. — Процесс оптимизации портфеля включает извлечение статистических и технических индикаторов из исторических цен, использование их в качестве входных данных для модели, преобразование выходных данных модели в веса портфеля с помощью линейной проекции и гиперболической функции активации, а также обучение модели путем минимизации отрицательного коэффициента Шарпа $\frac{\mu - r}{\sigma}$ .

Глубокое Обучение для Временных Рядов: Поиск Новых Горизонтов

Рекуррентные нейронные сети (RNN), и в особенности их вариант — долгосрочная краткосрочная память (LSTM) — получили широкое распространение в задачах анализа временных рядов благодаря способности моделировать долгосрочные зависимости. В отличие от традиционных моделей, неспособных эффективно обрабатывать информацию из удаленных моментов времени, LSTM используют специальные ячейки памяти и механизмы вентилей, позволяющие сохранять и использовать информацию на протяжении длительных последовательностей. Это достигается за счет комбинации ячейки памяти, входного вентиля, вентиля забывания и выходного вентиля, которые совместно регулируют поток информации, определяя, какая информация должна быть сохранена, забыта или передана на следующий временной шаг. Способность LSTM учитывать контекст предыдущих значений делает их эффективными для задач, где текущее значение зависит от значений, произошедших значительно раньше во времени, таких как прогнозирование финансовых рынков, распознавание речи и анализ климатических данных.

Стандартные сети LSTM, несмотря на свою эффективность в анализе временных рядов, могут быть вычислительно затратными, особенно при обработке длинных последовательностей данных. Это связано с необходимостью последовательной обработки каждого временного шага и сохранением информации в скрытом состоянии. Для решения этой проблемы была разработана архитектура xLSTM, которая включает в себя экспоненциальное гейтирование. Экспоненциальное гейтирование позволяет более эффективно управлять потоком информации, уменьшая вычислительную сложность и позволяя сети лучше обрабатывать длинные последовательности за счет более быстрого затухания устаревшей информации и фокусировки на актуальных данных. В результате, xLSTM обеспечивает повышение эффективности и снижение затрат ресурсов при анализе больших объемов временных данных.

Архитектура Transformer, первоначально разработанная для задач обработки естественного языка, находит применение и в прогнозировании временных рядов. Однако, в отличие от рекуррентных нейронных сетей, Transformer требует значительных вычислительных ресурсов, особенно при работе с длинными последовательностями. Это связано с механизмом внимания (attention), который вычисляет зависимости между всеми парами точек во временном ряду, что приводит к квадратичной сложности $O(n^2)$ по длине последовательности $n$ . Для снижения вычислительной нагрузки применяются различные методы, такие как разреженное внимание (sparse attention) и использование оконного внимания (windowed attention), которые ограничивают область вычислений внимания.

Результаты торговли xLSTM по фьючерсам на валюту показывают прибыльность по каждому активу.

Инновации в Архитектурах Transformer и LSTM: Расширение Границ Возможностей

Архитектура PatchTST повышает эффективность работы моделей на основе Transformer при обработке временных рядов за счет использования патч-эмбеддингов. Вместо применения Transformer непосредственно к полному временному ряду, данные разбиваются на небольшие, неперекрывающиеся сегменты (патчи). Затем эти патчи преобразуются в эмбеддинги и подаются на вход Transformer. Такой подход значительно снижает вычислительную сложность, особенно при обработке длинных последовательностей, поскольку уменьшается размер входной последовательности, и, следовательно, объем вычислений, связанных с механизмом внимания. Это позволяет использовать Transformer для задач, которые ранее были непрактичными из-за ограничений по вычислительным ресурсам и памяти.

PsLSTM представляет собой гибридную архитектуру, объединяющую преимущества патч-ориентированного представления данных и рекуррентных сетей LSTM. В основе подхода лежит разбиение временного ряда на отдельные патчи, которые затем обрабатываются LSTM-сетями. Это позволяет снизить вычислительную сложность по сравнению с традиционными Transformer-архитектурами, сохраняя при этом способность моделировать временные зависимости. Использование патчей также способствует улучшению параллелизации вычислений и повышению эффективности обучения, особенно при работе с длинными временными рядами. Архитектура PsLSTM позволяет извлекать как локальные, так и глобальные признаки, комбинируя возможности патч-ориентированного представления и рекуррентной обработки.

iTransformer отказывается от традиционного внимания, ориентированного на временные ряды, переходя к вниманию, основанному на признаках, что позволяет более эффективно улавливать взаимосвязи внутри данных. Этот подход позволяет модели сосредоточиться на корреляциях между признаками в каждый момент времени, а не на последовательных зависимостях. Параллельно, Mamba2 представляет собой селективную модель пространства состояний, использующую линейное внимание, что значительно снижает вычислительную сложность по сравнению с квадратичной сложностью стандартного внимания, обеспечивая повышенную эффективность и масштабируемость при обработке длинных последовательностей.

График отображает прибыльность (PnL) модели xLSTM для различных энергетических фьючерсов.

Оценка Эффективности и Управление Рисками: От Теории к Практике

Для оценки эффективности и управления рисками в финансовых моделях широко используются такие показатели, как коэффициент Шарпа и условная стоимость под риском (Conditional Value-at-Risk, CVaR). Коэффициент Шарпа позволяет оценить доходность, скорректированную на риск — то есть, сколько дополнительной доходности получает инвестор за каждую единицу принятого риска. В свою очередь, CVaR количественно определяет потенциальные потери в худших сценариях, позволяя оценить максимальный убыток, который может произойти с определенной вероятностью. Комбинированное использование этих метрик предоставляет комплексную оценку эффективности модели, учитывая как доходность, так и степень защиты от неблагоприятных событий, что критически важно для принятия обоснованных инвестиционных решений и эффективного управления портфелем.

Стратегии таргетирования волатильности используют полученные прогнозы для динамической корректировки весов активов в портфеле, что позволяет поддерживать заданный уровень риска. В основе этого подхода лежит постоянный мониторинг ожидаемой волатильности и соответствующее изменение структуры портфеля: при увеличении волатильности доля рискованных активов снижается, а при снижении — увеличивается. Такая адаптивная стратегия направлена на стабилизацию доходности и снижение потенциальных убытков, позволяя инвесторам поддерживать комфортный уровень риска вне зависимости от рыночной конъюнктуры. Эффективность подобных стратегий напрямую зависит от точности прогнозирования волатильности и скорости реагирования на изменения рыночных условий.

Межклассовое прогнозирование позволяет учитывать взаимосвязи между различными финансовыми инструментами, что значительно улучшает возможности диверсификации портфеля и снижения рисков. Вместо анализа каждого актива изолированно, данный подход моделирует зависимости между акциями, облигациями, валютами и другими классами активов, позволяя прогнозировать, как изменения в одном активе могут повлиять на другие. Это особенно важно в периоды рыночной турбулентности, когда корреляции между активами могут меняться. Эффективное моделирование этих зависимостей позволяет создавать более устойчивые портфели, способные лучше противостоять неблагоприятным рыночным условиям и обеспечивать более стабильную доходность.

В рамках данного исследования продемонстрировано, что модели глубокого обучения, в особенности вариационный долгосрочный LSTM (VLSTM), систематически превосходят линейные модели и другие архитектуры глубокого обучения. Достигнутое значение коэффициента Шарпа составляет 2.40 за период с 2010 по 2025 год, что свидетельствует о значительно более высокой эффективности, скорректированной на риск, по сравнению с альтернативными подходами. Полученные результаты подтверждают потенциал использования глубоких последовательных моделей для повышения доходности инвестиционных портфелей при одновременном контроле над уровнем риска.

Анализ максимальной просадки, как показателя потенциальных потерь, выявил, что передовые модели демонстрируют значения в диапазоне 10-20%. Особенно стабильное поведение в отношении максимальной просадки наблюдается у моделей VLSTM и xLSTM, которые сохраняют относительную устойчивость в различных классах активов. Это свидетельствует о том, что данные модели способны более эффективно справляться с неблагоприятными рыночными условиями и минимизировать риски значительных потерь по сравнению с другими архитектурами. Стабильность максимальной просадки является ключевым фактором для инвесторов, стремящихся к долгосрочному сохранению капитала и снижению волатильности портфеля.

Исследования показали, что модели, использующие адаптивные механизмы управления, демонстрируют более низкий показатель условной ценности под риском (CVaR 5%), находясь в диапазоне от 5 до 10% для передовых моделей. Это свидетельствует о повышенной способности этих моделей защищать инвесторов от значительных потерь в неблагоприятных рыночных условиях. Низкий CVaR указывает на то, что вероятность превышения определённого уровня убытков существенно снижается, что делает такие модели привлекательными для управления рисками и обеспечения стабильности портфеля. Эффективность адаптивных механизмов в снижении CVaR подтверждает их потенциал для улучшения стратегий защиты от рисков и повышения устойчивости инвестиционных портфелей к непредсказуемости финансовых рынков.

Анализ оборачиваемости портфеля, выраженной через показатель xGMV, демонстрирует, что передовые модели характеризуются умеренными транзакционными издержками. Зафиксированные значения оборачиваемости в диапазоне 0.5-1.0 указывают на то, что частота операций по перебалансировке портфеля остается контролируемой. Это, в свою очередь, снижает влияние комиссий и спредов на общую доходность стратегии, делая ее более привлекательной для практической реализации. Низкий уровень оборачиваемости свидетельствует о способности моделей эффективно использовать существующие позиции, минимизируя необходимость в частой смене активов и, следовательно, уменьшая сопутствующие расходы.

Результаты исследований демонстрируют, что разработанные модели характеризуются низким порогом безубыточности транзакционных издержек, находящимся в диапазоне от 5 до 20 базисных пунктов. Это указывает на высокую практическую применимость предложенных подходов в реальных торговых стратегиях. Низкий уровень транзакционных издержек позволяет минимизировать негативное влияние на общую прибыльность портфеля, делая модели привлекательными для институциональных инвесторов и трейдеров, стремящихся к оптимизации затрат и повышению эффективности управления рисками. Полученные данные свидетельствуют о том, что внедрение этих моделей не потребует существенных изменений в текущей инфраструктуре и не приведет к значительным потерям прибыли из-за комиссий и других торговых расходов.

Стратегия таргетирования волатильности позволяет эффективно управлять объемом экспозиции в зависимости от рыночной ситуации.

Исследование демонстрирует, что эффективное управление финансовыми временными рядами не требует централизованного проектирования, а скорее возникает из локальных правил, заложенных в архитектуре рекуррентных и пространственных моделей. Как отметила Мэри Уолстонкрафт: «Разум — это единственная сила, способная направить человека к добродетели». Аналогично, в данной работе, оптимизация моделей для коэффициента Шарпа позволяет выявить внутреннюю логику рыночных данных, а не навязывать ей внешние директивы. Эта закономерность подчеркивает, что порядок в сложных системах, таких как финансовые рынки, формируется в результате взаимодействия локальных элементов, а не централизованного контроля.

Куда же дальше?

Представленные результаты, демонстрируя превосходство рекуррентных и пространственных моделей в прогнозировании финансовых временных рядов, лишь подчеркивают фундаментальную истину: порядок возникает не из стремления к контролю, а из локального взаимодействия. Оптимизация по коэффициенту Шарпа — это не навязывание желаемого результата, а выявление естественных закономерностей в хаосе данных. Однако, настоящая сложность заключается не в построении более сложных моделей, а в признании границ их применимости.

Предсказуемость финансовых рынков — иллюзия, подпитываемая потребностью в ней. Вместо того, чтобы стремиться к абсолютному прогнозу, стоит обратить внимание на развитие методов, способных адаптироваться к изменяющимся условиям, распознавать нелинейности и оценивать степень собственной неопределенности. Попытки «проиграть красиво» — то есть, минимизировать риски в условиях непредсказуемости — могут оказаться более плодотворными, чем погоня за максимальной прибылью.

Иногда, наиболее эффективной стратегией является пассивность — наблюдение за тем, как система самоорганизуется, вместо попыток её насильственного изменения. Дальнейшие исследования должны быть направлены на создание не столько «умных» моделей, сколько инструментов для понимания и адаптации к неизбежному хаосу, присущему финансовым рынкам. Ведь порядок, в конечном счете, не нуждается в архитекторе.

Оригинал статьи: https://arxiv.org/pdf/2603.01820.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-03 10:56