Предсказание облигаций: когда важна не архитектура, а данные

Автор: Денис Аветисян


Новое исследование показывает, что для точного прогнозирования финансовых временных рядов ключевым фактором является правильная предобработка данных и соответствие индуктивного смещения модели, а не сложность нейронной сети.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал
Ежедневные изменения доходности по индексу U.S. Aggregate Bond Index за период с 2018 по 2026 год демонстрируют динамику колебаний на рынке облигаций, отражая ежедневные колебания стоимости агрегированного портфеля облигаций США.
Ежедневные изменения доходности по индексу U.S. Aggregate Bond Index за период с 2018 по 2026 год демонстрируют динамику колебаний на рынке облигаций, отражая ежедневные колебания стоимости агрегированного портфеля облигаций США.

Анализ показывает, что дробное дифференцирование и выравнивание индуктивного смещения оказывают большее влияние на точность прогнозирования индекса U.S. Aggregate Bond, чем применение сверточных нейронных сетей.

Несмотря на растущую популярность сложных архитектур глубокого обучения, их эффективность в прогнозировании финансовых временных рядов остается предметом дискуссий. В работе ‘Deep Learning Forecasting of the U.S. Aggregate Bond Index’ исследуются возможности методов глубокого обучения для прогнозирования динамики американского агрегированного фондового индекса облигаций, охватывая период с 2018 по 2026 год. Полученные результаты указывают на то, что ключевым фактором, определяющим точность прогнозов, является не сложность модели, а предварительная обработка данных — в частности, применение дробного дифференцирования для достижения оптимального баланса между стационарностью и сохранением информации. Может ли более тщательный подбор методов предобработки данных и учет индуктивных смещений моделей стать ключом к повышению эффективности прогнозирования финансовых временных рядов, превосходя преимущества сложных архитектур?


Раскрывая Сложность Облигационных Рынков

Финансовые временные ряды, такие как индекс U.S. Aggregate Bond, зачастую демонстрируют характеристики, не соответствующие стандартным статистическим предположениям. Традиционные модели, основанные на нормальном распределении и независимости данных, часто оказываются неадекватными для описания динамики облигационных рынков. Наблюдаемые отклонения включают в себя нелинейности, неравномерное распределение доходностей и склонность к экстремальным значениям, что указывает на необходимость применения более сложных статистических инструментов и моделей для точного анализа и прогнозирования. Эти особенности требуют пересмотра подходов к оценке рисков и построению инвестиционных стратегий, поскольку стандартные методы могут недооценивать вероятность наступления неблагоприятных событий.

Анализ финансовых временных рядов, в частности, индексов облигаций, выявляет отклонения от предположений, лежащих в основе стандартных статистических моделей. Наблюдаемые явления, такие как кластеризация волатильности и «толстые хвосты» распределений, указывают на то, что периоды высокой волатильности, как правило, сменяются другими периодами высокой волатильности, а экстремальные события происходят чаще, чем предсказывают нормальные распределения. Кластеризация волатильности проявляется в том, что изменения цен в определенный период времени демонстрируют тенденцию к концентрации — большие колебания, как правило, следуют за большими колебаниями, и наоборот. «Толстые хвосты» же означают, что вероятность возникновения событий, выходящих за пределы ожидаемого диапазона, значительно выше, чем предполагает нормальное распределение. Эти особенности требуют применения более сложных моделей, учитывающих нелинейные зависимости и способных адекватно отражать динамику рынков облигаций, что критически важно для точного прогнозирования и эффективного управления рисками.

Анализ динамики облигационных рынков выявляет значительную степень нелинейности, что критически важно для точного прогнозирования и управления рисками. Исследования показывают, что временные ряды, такие как индекс U.S. Aggregate Bond, демонстрируют высокую степень автокорреляции — коэффициент автокорреляции первого порядка (ρ1) достигает значения 0.998 для исходного ряда уровней. Это указывает на так называемую “близость к единичному корню”, означающую, что текущие изменения цен облигаций тесно связаны с предыдущими, а тенденции сохраняются на протяжении длительного времени. Вследствие этого, стандартные статистические модели, предполагающие независимость и нормальное распределение, часто оказываются неадекватными для описания поведения облигационных рынков, что требует применения более сложных, учитывающих нелинейные зависимости, методов анализа и прогнозирования.

Применение дробного дифференцирования с параметром <span class="katex-eq" data-katex-display="false">d=0.4</span> к индексу U.S. Aggregate Bond позволяет получить стационарный, но максимально устойчивый временной ряд.
Применение дробного дифференцирования с параметром d=0.4 к индексу U.S. Aggregate Bond позволяет получить стационарный, но максимально устойчивый временной ряд.

Установление Основы: Стационарность и Анализ Временных Рядов

Стационарность является ключевым понятием в анализе временных рядов, обозначающим, что статистические свойства ряда — такие как среднее значение, дисперсия и автокорреляция — остаются неизменными во времени. Это означает, что распределение вероятностей ряда не изменяется при сдвиге во времени. Отсутствие стационарности может приводить к ложным результатам при моделировании и прогнозировании, поскольку статистические методы, предполагающие постоянство свойств, будут неприменимы. Для корректного анализа временных рядов необходимо убедиться в их стационарности или применить преобразования для достижения стационарности, например, дифференцирование или логарифмирование.

Для оценки и достижения стационарности временных рядов используются методы дифференцирования и тест Аугментированного Дики-Фуллера (ADF). Дифференцирование предполагает вычисление разностей между последовательными наблюдениями, что позволяет устранить тренды и сезонность, делая ряд более стабильным. Тест ADF, в свою очередь, является статистическим тестом, проверяющим гипотезу о наличии единичного корня в ряде времен, что указывает на нестационарность. p-значение, полученное в результате теста ADF, используется для принятия решения о стационарности ряда: значение меньше определенного уровня значимости (например, 0.05) свидетельствует об отклонении нулевой гипотезы о нестационарности и подтверждает стационарность ряда. Различные порядки дифференцирования могут применяться для достижения стационарности, и выбор оптимального порядка часто основывается на анализе автокорреляционной и частной автокорреляционной функций (ACF и PACF).

В финансовых данных часто наблюдается эффект долгой памяти, когда прошлые события продолжают оказывать влияние на будущие значения ряда. Простое дифференцирование, хотя и может устранить некоторые тренды и сезонность, не всегда способно адекватно отразить эту долгосрочную зависимость. Это связано с тем, что стандартные методы, такие как \Delta x_t = x_t - x_{t-1} , учитывают только непосредственное прошлое, игнорируя более отдаленные влияния. В результате, модели, построенные на основе простого дифференцирования, могут недооценивать волатильность и давать неточные прогнозы, особенно при анализе временных рядов с ярко выраженной долгой памятью.

Для приведения временных рядов к стационарному виду, что необходимо для корректного проведения дальнейшего анализа, часто используется преобразование к логарифмическим доходностям (log returns). Данный метод позволяет стабилизировать дисперсию и устранить тренды, приводя ряд к состоянию, где его статистические характеристики не меняются во времени. Подтверждением достижения стационарности в данном случае служит результат теста Дики-Фуллера (ADF), значение p-value которого для рядов, подвергнутых частичному дифференцированию, составляет 0.013, что ниже общепринятого уровня значимости (например, 0.05) и свидетельствует об отклонении нулевой гипотезы о нестационарности.

Анализ значений ADFpp показывает, что порядок дифференцирования, необходимый для достижения стационарности исходного (слева) и логарифмически преобразованного (справа) временного ряда, определяется пересечением кривой с линией значимости в 1%.
Анализ значений ADFpp показывает, что порядок дифференцирования, необходимый для достижения стационарности исходного (слева) и логарифмически преобразованного (справа) временного ряда, определяется пересечением кривой с линией значимости в 1%.

Улавливая Долгосрочные Зависимости: Дробное Дифференцирование

Традиционное дифференцирование временных рядов предполагает вычитание предыдущего значения ряда из текущего, что эквивалентно дифференцированию первого порядка. Фракционное дифференцирование расширяет этот подход, позволяя использовать нецелые порядки дифференцирования, например, 0.4 или 0.45. Вместо однократного вычитания предыдущего значения, фракционное дифференцирование использует взвешенную сумму предыдущих значений, определяемую нецелым порядком дифференцирования. Это позволяет более точно моделировать процессы с долгой памятью, где текущее значение ряда зависит от значений, полученных за более длительный период времени, чем это учитывается при стандартном дифференцировании.

Фракционное дифференцирование эффективно моделирует процессы с долгой памятью, сохраняя информацию, которая теряется при использовании стандартного дифференцирования. Традиционное дифференцирование, применяемое целое число раз, может удалять важные временные зависимости, особенно в данных, демонстрирующих персистентность. Фракционное дифференцирование, позволяющее применять дифференцирование дробного порядка (например, 0.4), позволяет учесть эти зависимости, поскольку оно не отбрасывает информацию о прошлых значениях столь агрессивно. Это приводит к более точному представлению динамики временных рядов и, следовательно, к улучшению качества прогнозов, поскольку сохраняются исторические зависимости, влияющие на текущие и будущие значения.

В рамках анализа временных рядов, фракционное дифференцирование обеспечивает более надежную основу для прогнозирования благодаря точному учету долгосрочных зависимостей. Оптимальный порядок фракционного дифференцирования, выявленный в ходе исследований U.S. Aggregate Bond Index, составил от 0.40 до 0.45. Использование данного порядка позволяет более эффективно моделировать долгосрочную память процессов и повышает точность прогнозов по сравнению с традиционными методами дифференцирования, которые могут приводить к потере ценной информации о временных зависимостях.

Традиционные методы анализа временных рядов часто не учитывают сложные зависимости в данных, что приводит к неточностям в прогнозировании. В отличие от них, применение дробного дифференцирования к данным Индекса U.S. Aggregate Bond позволило адаптироваться к нюансам его динамики, что обеспечило более точное моделирование долгосрочных зависимостей. Данный подход, в отличие от стандартного дифференцирования, сохраняет информацию о временной структуре данных, что особенно важно для финансовых инструментов, характеризующихся долгосрочной памятью. Оптимальный порядок дробного дифференцирования для данного индекса был установлен в диапазоне от 0.40 до 0.45.

На тестовом сегменте, прогнозы модели MLP и наивного подхода для частично дифференцированного ряда (d=0.4) демонстрируют различные траектории.
На тестовом сегменте, прогнозы модели MLP и наивного подхода для частично дифференцированного ряда (d=0.4) демонстрируют различные траектории.

Использование Глубокого Обучения для Повышения Точности Прогнозирования

Свёрточные нейронные сети (CNN) и многослойные перцептроны (MLP) представляют собой мощные инструменты для прогнозирования временных рядов. CNN эффективно обрабатывают данные, преобразованные в двумерное представление, в то время как MLP способны моделировать сложные нелинейные зависимости непосредственно из исходных данных. Оба подхода позволяют превзойти традиционные статистические модели, особенно при анализе данных с выраженными нелинейностями и сложными паттернами. Оценка производительности этих моделей осуществляется с использованием метрик, таких как среднеквадратичная ошибка (RMSE) и средняя абсолютная ошибка (MAE), что позволяет объективно сравнить их эффективность в различных задачах прогнозирования.

Для эффективного применения сверточных нейронных сетей (CNN) к задачам прогнозирования временных рядов, исходные данные преобразуются в двухмерное изображение с использованием метода Грамова поля углов (Gramian Angular Field, GAF). GAF кодирует временной ряд в виде изображения, сохраняя информацию о временных зависимостях и фазовых отношениях между точками данных. Этот процесс позволяет CNN, изначально разработанным для обработки изображений, эффективно извлекать признаки из временных рядов и использовать их для прогнозирования. Преобразование в GAF является ключевым этапом, обеспечивающим совместимость данных временных рядов с архитектурой CNN.

Для оценки производительности моделей сверточных нейронных сетей (CNN) и многослойных перцептронов (MLP) в задачах прогнозирования временных рядов используются метрики, такие как среднеквадратичная ошибка (Root Mean Squared Error, RMSE) и средняя абсолютная ошибка (Mean Absolute Error, MAE). RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}, где y_i — фактическое значение, а \hat{y}_i — прогноз. MAE рассчитывается как среднее абсолютное отклонение между фактическими и прогнозируемыми значениями. Использование этих метрик позволяет количественно оценить точность моделей и сравнить их эффективность, предоставляя объективную основу для выбора оптимальной модели прогнозирования.

Применение методов глубокого обучения, таких как многослойные перцептроны (MLP) и сверточные нейронные сети (CNN), демонстрирует потенциал превосходства над традиционными статистическими моделями за счет способности улавливать сложные, нелинейные зависимости в данных временных рядов. В ходе проведенного исследования, MLP, обученный на частично дифференцированном временном ряде, достиг коэффициента детерминации R^2 равного 0.57. Данный результат значительно превосходит производительность CNN, обученной на исходном уровне временного ряда, которая показала отрицательное значение R^2 (-4.68), что свидетельствует о более эффективном улавливании закономерностей MLP в данном контексте.

Оценка предсказательной способности CNN-GAF моделей показывает, что различные варианты входных представлений данных влияют на точность прогнозирования.
Оценка предсказательной способности CNN-GAF моделей показывает, что различные варианты входных представлений данных влияют на точность прогнозирования.

Исследование показывает, что в предсказании финансовых временных рядов, корректная предварительная обработка данных, в частности, фракционное дифференцирование, играет более важную роль, чем сложность архитектуры нейронной сети. Это напоминает о необходимости глубокого понимания системы перед попытками её взлома. Как заметил Эпикур: «Не тот человек богат, у которого много добра, а тот, кто доволен малым». По сути, исследование демонстрирует, что эффективное решение часто кроется не в усложнении, а в тонкой настройке базовых принципов и понимании стационарности данных — подобно тому, как философ искал спокойствие в простоте.

Куда же дальше?

Представленная работа, по сути, продемонстрировала старую истину: изящный алгоритм, работающий на грязных данных, уступит место простому решению, подпитанному тщательно подготовленной информацией. Упор на дробное дифференцирование, как способ наведения порядка в хаосе временных рядов, — это не столько технологический прорыв, сколько признание необходимости вернуться к основам. Иллюзия, будто сложные архитектуры, такие как сверточные нейронные сети, способны самостоятельно извлечь смысл из шума, оказалась несостоятельной. Это — эксплуат, раскрывающий слабость в самой концепции «черного ящика».

Необходимо признать, что вопрос стационарности ряда, несмотря на все усилия, остаётся нерешенным окончательно. Автокорреляция, как призрачная сущность, продолжает ускользать от полного контроля. Будущие исследования должны быть направлены не на создание всё более изощрённых моделей, а на разработку более эффективных методов предварительной обработки и выявления скрытых закономерностей в данных. Понимание природы нестационарности, а не её маскировка, — вот истинная задача.

Индуктивный уклон модели, как оказалось, играет решающую роль. Но что, если сам выбор этого уклона — лишь отражение наших собственных когнитивных искажений? Возможно, истинный прогресс заключается не в создании «умных» алгоритмов, а в преодолении человеческой предвзятости при анализе финансовых данных. Это — взлом системы, но не кода, а сознания.


Оригинал статьи: https://arxiv.org/pdf/2605.27977.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-05-28 15:03