Неликвидные рынки: новый взгляд на перенос обучения

Автор: Денис Аветисян


Исследование предлагает инновационный подход к оценке рисков на опционных рынках с низкой ликвидностью, используя возможности глубокого обучения и перенос знаний.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Бесплатный Телеграм канал
Модель Бейтса используется для построения кривых подразумеваемой волатильности, где неликвидная целевая волатильность (синий цвет) аппроксимируется ликвидным прокси-активом (оранжевый цвет) для обучения модели.
Модель Бейтса используется для построения кривых подразумеваемой волатильности, где неликвидная целевая волатильность (синий цвет) аппроксимируется ликвидным прокси-активом (оранжевый цвет) для обучения модели.

Представлена архитектура Deep-LSE с переносом обучения для точной оценки плотности риска нейтрального агента даже при ограниченных данных.

Оценка нейтральной к риску плотности (RND) по ценам опционов представляет собой сложную задачу, особенно на неликвидных рынках. В работе ‘Transfer Learning (Il)liquidity’ предложена архитектура глубокой нейронной сети Log-Sum-Exp, использующая глубокое обучение и перенос знаний для повышения точности оценки RND при наличии нерегулярных и неликвидных страйков. Показано, что разработанная модель обеспечивает устойчивую оценку RND даже в условиях экстремальной неликвидности, требуя всего несколько котировок опционов. Возможно ли дальнейшее совершенствование методов оценки RND за счет комбинирования различных подходов машинного обучения и традиционных моделей финансовой математики?


Математическая Элегантность Оценки Риска

Точное определение функции плотности вероятности в нейтральном к риску мире, известной как риск-нейтральная плотность (РНП), является краеугольным камнем при оценке стоимости производных финансовых инструментов и управлении рисками. РНП позволяет определить вероятности различных будущих состояний актива, не учитывая предпочтения инвестора к риску, что необходимо для справедливой оценки опционов и других сложных финансовых продуктов. Отклонения в оценке РНП, даже незначительные, могут привести к существенным ошибкам в ценообразовании и, как следствие, к значительным финансовым потерям, особенно при торговле на неликвидных рынках. Поэтому, разработка и применение точных методов оценки РНП остается одной из ключевых задач в современной финансовой математике и риск-менеджменте. Использование, например, методов, основанных на $Heston$ модели или других продвинутых стохастических моделях волатильности, направлено на повышение точности оценки РНП и, соответственно, улучшение управления финансовыми рисками.

Традиционные стохастические модели волатильности, такие как BatesModel, KouModel и AndersenBenzoniLundModel, несмотря на свою полезность в анализе финансовых рисков, сталкиваются со значительными трудностями при применении к неликвидным рынкам. Проблема заключается в сложности точной оценки параметров этих моделей, поскольку для этого требуется достаточное количество исторических данных и активная торговля соответствующими активами. В условиях низкой ликвидности, когда сделок мало и ценовые котировки редки, статистическая оценка параметров становится ненадежной и приводит к существенным погрешностям в прогнозировании волатильности и, как следствие, в оценке рисков. Это особенно критично при ценообразовании деривативов и управлении портфелями, поскольку неточности в оценке волатильности могут привести к значительным финансовым потерям. Невозможность адекватно откалибровать параметры моделей в условиях неликвидности ограничивает их практическую применимость и требует разработки альтернативных подходов к моделированию финансовых рисков.

Существующие модели оценки финансовых рисков, такие как BatesModel, KouModel и AndersenBenzoniLundModel, опираются на ряд упрощающих предположений о поведении рынков. В частности, часто предполагается нормальное распределение доходностей активов или постоянство волатильности. Однако реальные рынки демонстрируют отклонения от этих предположений — наблюдаются «толстые хвосты» распределений, а также периоды высокой волатильности, сменяющиеся периодами относительного спокойствия. Когда эти допущения не соответствуют действительности, модели дают неточные оценки рисков, что может привести к существенным финансовым потерям для инвесторов и организаций, использующих их для принятия решений. Неспособность адекватно учитывать рыночную динамику в условиях низкой ликвидности или при наличии экстремальных событий особенно усугубляет эту проблему, подчеркивая необходимость разработки более гибких и реалистичных подходов к моделированию финансовых рисков.

Сравнение восстановления неликвидной волатильности Deep-LSE и квадратичных сплайнов с эталонными данными показывает, что оба метода позволяют эффективно аппроксимировать кривую неликвидной волатильности, выделяя точки выборки для целевой кривой (зеленые крестики) на фоне исходной неликвидной кривой (оранжевый цвет).
Сравнение восстановления неликвидной волатильности Deep-LSE и квадратичных сплайнов с эталонными данными показывает, что оба метода позволяют эффективно аппроксимировать кривую неликвидной волатильности, выделяя точки выборки для целевой кривой (зеленые крестики) на фоне исходной неликвидной кривой (оранжевый цвет).

Глубокое Обучение для Оценки Риск-Нейтральной Плотности

Глубокая нейронная сеть DeepLogSumExpNeuralNetwork представляет собой новый подход к оценке RND (Random Number Diffusion), использующий возможности глубокого обучения для преодоления ограничений традиционных моделей. В отличие от классических методов, которые часто полагаются на упрощенные предположения о распределении случайных чисел и могут демонстрировать низкую точность в сложных сценариях, данная модель способна улавливать нелинейные зависимости и адаптироваться к различным типам данных. Это достигается за счет использования многослойной нейронной сети, которая обучается непосредственно на данных RND, позволяя модели строить более точные и надежные прогнозы по сравнению с параметрическими или эвристическими подходами. Особенно актуально это в задачах, где требуется высокая точность оценки RND, например, в моделировании финансовых рынков или в задачах криптографии.

Модель использует функцию LogSumExp для обеспечения выпуклости, что способствует повышению стабильности и интерпретируемости. Функция $LogSumExp(x) = \log(\sum_{i} e^{x_i})$ гарантирует, что оптимизационная задача является выпуклой, что позволяет избежать локальных минимумов и обеспечивает более надежную сходимость алгоритма обучения. Выпуклость упрощает анализ и предсказуемость поведения модели, а также облегчает выбор оптимальных параметров. Использование LogSumExp обеспечивает численные преимущества, предотвращая переполнение и недополнение при вычислении экспоненциальных значений, что особенно важно при работе с большими объемами данных и сложными моделями.

Использование архитектуры нейронной сети в DeepLogSumExpNeuralNetwork позволяет модели адаптироваться к сложным динамикам рынка и более точно улавливать нюансы случайной величины $RND$. Традиционные методы оценки $RND$ часто сталкиваются с трудностями при моделировании нелинейных зависимостей и изменений в данных. Нейронная сеть, благодаря своей способности к обучению сложным функциям, эффективно обрабатывает нелинейные взаимосвязи и может выявлять закономерности в данных, которые остаются незамеченными другими подходами. Это приводит к повышению точности оценки $RND$ и улучшению производительности модели в различных рыночных условиях.

Восстановление неликвидного RND для Deep-LSE (оранжевая кривая) и квадратичных сплайнов (зеленая кривая) демонстрирует их сходимость к целевому, смоделированному RND (синяя кривая).
Восстановление неликвидного RND для Deep-LSE (оранжевая кривая) и квадратичных сплайнов (зеленая кривая) демонстрирует их сходимость к целевому, смоделированному RND (синяя кривая).

Перенос Обучения для Неликвидных Рынков: Математическая Строгость

Неликвидность представляет собой существенное препятствие для оценки $RND$ (Realized Net Discount), поскольку ограниченный объем торговых данных приводит к ненадежной оценке параметров модели. При низкой ликвидности, количество доступных сделок и котировок недостаточно для точного определения ключевых факторов, влияющих на $RND$, таких как волатильность и время до экспирации. Это, в свою очередь, увеличивает погрешность оценки и снижает точность прогнозирования, что особенно критично для финансовых инструментов с низкой оборачиваемостью. Недостаток данных также затрудняет калибровку моделей и приводит к повышенной чувствительности к шуму и случайным колебаниям рынка.

Перенос обучения (TransferLearning) решает проблему оценки $RND$ в условиях низкой ликвидности, используя информацию, полученную из ликвидных сопутствующих рынков. Этот подход заключается в передаче знаний, полученных на данных из рынков с высоким объемом торгов, для улучшения оценки параметров на целевых рынках с ограниченным количеством сделок. В частности, предварительно обученная модель на ликвидных рынках используется в качестве отправной точки, а затем дообучается на данных с неликвидных рынков, что позволяет более эффективно использовать ограниченный объем доступной информации и повысить точность оценки $RND$.

Применение Transfer Learning позволяет существенно снизить погрешность оценки и повысить устойчивость нейронной сети DeepLogSumExpNeuralNetwork в сложных рыночных условиях. В частности, достигается точное восстановление $RND$ (Realized Net Discount) даже при наличии всего трех котировок опционов. Это особенно важно для неликвидных рынков, где традиционные методы оценки подвержены значительным ошибкам из-за недостатка данных. Уменьшение количества необходимых котировок для точной оценки $RND$ снижает транзакционные издержки и повышает эффективность стратегий торговли опционами на неликвидных рынках.

В сценарии с низкой ликвидностью, Deep-LSE (оранжевая кривая) и квадратичные сплайны (зеленая кривая) восстанавливают RND, приближаясь к эталонному симулированному значению (синяя кривая).
В сценарии с низкой ликвидностью, Deep-LSE (оранжевая кривая) и квадратичные сплайны (зеленая кривая) восстанавливают RND, приближаясь к эталонному симулированному значению (синяя кривая).

Валидация и Сравнительная Эффективность: Доказательство Превосходства

Для оценки эффективности разработанной нейронной сети DeepLogSumExp использовался общепринятый набор данных SPXOptionData, представляющий собой стандартный эталон для моделей ценообразования опционов. Этот набор данных, содержащий информацию о ценах опционов на индекс S&P 500, позволил провести объективное сравнение с существующими методами. Использование SPXOptionData гарантирует, что результаты, полученные для DeepLogSumExpNeuralNetwork, могут быть сопоставлены и проверены другими исследователями в области финансового моделирования, что способствует повышению доверия к полученным результатам и валидации предложенного подхода к оценке опционов. Выбор данного набора данных обусловлен его широкой известностью и доступностью, что делает возможным воспроизведение и проверку результатов исследования.

В ходе сравнительного анализа точности оценки опционов, разработанная нейронная сеть DeepLogSumExpNeuralNetwork продемонстрировала существенное превосходство над традиционным методом квадратичных сплайнов (QuadraticSplines). Оценка производилась на стандартном наборе данных SPXOptionData, и результаты показали, что нейронная сеть достигла наименьшей средней абсолютной ошибки ($MeanAbsoluteError$) при определении цены опционов. Данный показатель оказался значительно лучше, чем у других моделей, включая Kernel, Maximum-Entropy и Mixture модели, что подтверждает эффективность предложенного подхода и его потенциал для более точного ценообразования опционов в финансовых приложениях.

Для подтверждения теоретической состоятельности разработанного оценщика, в рамках исследования была применена методика Sieve-оценки. Этот подход позволил установить, что при увеличении объема данных, полученные оценки будут сходиться к истинным значениям, обеспечивая надежность и стабильность результатов. Использование Sieve-оценки не только подтверждает математическую корректность модели, но и повышает уверенность в ее способности к точному прогнозированию, особенно в условиях финансовых рынков, где даже незначительные погрешности могут привести к существенным последствиям. Таким образом, данный метод выступает в качестве важного инструмента верификации и гарантии надежности предложенного подхода к оценке опционов.

В сценарии с неликвидным восстановлением, Deep-LSE (оранжевая кривая) и квадратичные сплайны (зеленая кривая) демонстрируют сопоставимые результаты с целевым значением RND, смоделированным в условиях неликвидности (синяя кривая).
В сценарии с неликвидным восстановлением, Deep-LSE (оранжевая кривая) и квадратичные сплайны (зеленая кривая) демонстрируют сопоставимые результаты с целевым значением RND, смоделированным в условиях неликвидности (синяя кривая).

Перспективы Развития и Более Широкие Последствия: На Пути к Элегантности

Архитектура DeepLogSumExpNeuralNetwork обладает значительным потенциалом для дальнейшего развития и адаптации к изменяющимся условиям рынка. В настоящее время, исследования направлены на включение в модель более сложных факторов, таких как макроэкономические показатели, настроения инвесторов, и данные из альтернативных источников. Внедрение механизмов динамического обучения позволит сети адаптироваться к новым рыночным тенденциям и повышать точность прогнозов. Кроме того, предполагается расширение функциональности за счет интеграции с системами управления рисками и алгоритмической торговли, что позволит использовать полученные прогнозы для автоматизированного принятия решений и оптимизации инвестиционных стратегий. В будущем, модель сможет учитывать нелинейные зависимости и сложные взаимодействия между различными рыночными факторами, обеспечивая более реалистичную и надежную оценку опционов и других финансовых инструментов, а также предсказывать изменения волатильности и ценообразовании.

Предложенная методология, изначально разработанная для оценки опционов, обладает значительным потенциалом для применения в смежных областях финансового моделирования. В частности, принципы, лежащие в основе DeepLogSumExpNeuralNetwork, могут быть успешно адаптированы для построения моделей оценки кредитного риска, позволяя более точно прогнозировать вероятность дефолта заемщиков и оптимизировать стратегии управления кредитными портфелями. Кроме того, данный подход открывает возможности для совершенствования алгоритмов оптимизации инвестиционных портфелей, учитывая сложные взаимосвязи между активами и стремясь к максимальной доходности при заданном уровне риска. По сути, универсальность архитектуры позволяет использовать ее для решения широкого спектра задач, связанных с количественной оценкой и управлением финансовыми рисками, что делает ее перспективным инструментом для финансовых институтов и инвесторов.

Сочетание возможностей глубокого обучения и передовых статистических методов открывает новые перспективы в разработке инструментов для управления финансовыми рисками в условиях растущей сложности мировой экономики. Традиционные модели часто сталкиваются с трудностями при обработке нелинейных взаимосвязей и больших объемов данных, характерных для современных финансовых рынков. Использование глубоких нейронных сетей позволяет выявлять скрытые закономерности и прогнозировать риски с большей точностью, в то время как статистические методы обеспечивают надежную оценку неопределенности и позволяют учитывать факторы, которые сложно формализовать. Такой синергетический подход способствует созданию более устойчивых и надежных систем, способных адаптироваться к меняющимся рыночным условиям и эффективно управлять рисками в различных финансовых сценариях, включая оценку опционов, кредитный анализ и оптимизацию инвестиционного портфеля. Перспективные исследования направлены на интеграцию этих методов с учетом временных рядов и стохастических процессов, что позволит создавать прогностические модели с повышенной степенью достоверности и гибкости, необходимые для принятия обоснованных финансовых решений.

Модель Deep-LSE точно аппроксимирует кривую подразумеваемой волатильности ликвидного базового актива, что демонстрируется на примере первого шага восстановления в сценарии 1.
Модель Deep-LSE точно аппроксимирует кривую подразумеваемой волатильности ликвидного базового актива, что демонстрируется на примере первого шага восстановления в сценарии 1.

Представленное исследование демонстрирует стремление к математической чистоте в оценке риско-нейтральной плотности, особенно в условиях неликвидных опционных рынков. Разработанная Deep-LSE сеть с применением трансферного обучения позволяет достичь высокой точности даже при ограниченных данных, что соответствует принципу доказательства корректности вместо слепой веры в эмпирические результаты. Как отмечал Джон Стюарт Милль: «Недостаточно знать, что мы делаем; необходимо также знать, почему мы это делаем». Именно стремление к пониманию фундаментальных принципов, а не просто к получению рабочих результатов, лежит в основе данного подхода к проблеме оценки неликвидности и волатильности.

Что дальше?

Представленная работа, безусловно, демонстрирует потенциал переноса обучения в оценке риск-нейтральной плотности, особенно в условиях ограниченных данных. Однако, если кажущаяся магия Deep-LSE объясняется лишь удачной архитектурой, а не глубоким пониманием инвариантов, то истинный прогресс остаётся за горизонтом. Следующим шагом представляется не просто увеличение объёма обучающих данных, а формализация принципов переноса обучения, применимых к классу задач, где традиционные методы терпят неудачу из-за недостатка ликвидности.

Особое внимание следует уделить исследованию устойчивости предложенного подхода к различным типам неликвидности и шумам в данных. Если модель демонстрирует высокую точность лишь на «идеальных» опционах, то её практическая ценность вызывает сомнения. Более того, необходимо разработать методы верификации и валидации, позволяющие убедиться в корректности полученных оценок риск-нейтральной плотности, а не полагаться исключительно на сравнение с другими, столь же несовершенными, моделями.

Наконец, представляется важным исследовать возможности интеграции предложенного подхода с другими методами оценки неликвидности, такими как sieve estimation. Если модель способна лишь «угадывать» неликвидность на основе имплицитной волатильности, то это лишь временное решение. Истинная элегантность заключается в создании алгоритма, который явно учитывает и моделирует факторы, влияющие на неликвидность, и позволяет её точно измерить.


Оригинал статьи: https://arxiv.org/pdf/2512.11731.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-15 09:19