Торгуют ли нейросети вслепую? Новый подход к оптимизации портфеля

Автор: Денис Аветисян

Исследование предлагает инновационный метод анонимизации данных, позволяющий использовать большие языковые модели для эффективной торговли на финансовых рынках, даже при отсутствии прямой информации о прошлых ценах.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал

В рамках исследования разработан конвейер BlindTrade, включающий анонимизацию данных, генерацию признаков с использованием многоагентных больших языковых моделей, проверку целостности (IC), кодирование SemGAT, обучение с подкреплением, обусловленное намерениями (PPO-DSR), и последующее бэктестирование, что позволяет оптимизировать стратегии торговли с учетом конфиденциальности и эффективности.

Представлен BlindTrade — фреймворк, объединяющий анонимизацию, графовые нейронные сети и обучение с подкреплением для снижения рисков, связанных с запоминанием данных и предвзятостью, и повышения устойчивости портфеля в волатильных условиях.

Несмотря на растущий интерес к использованию больших языковых моделей (LLM) в финансовой торговле, сохраняется риск, что демонстрируемая прибыльность обусловлена запоминанием исторических данных, а не пониманием рыночной динамики. В данной работе, озаглавленной ‘Can Blindfolded LLMs Still Trade? An Anonymization-First Framework for Portfolio Optimization’, предложен подход BlindTrade, основанный на анонимизации идентификаторов и использовании графовых нейронных сетей (GNN) в сочетании с обучением с подкреплением (RL) для построения портфеля. Эксперименты на данных за 2024-2025 годы показали, что разработанная система способна демонстрировать коэффициент Шарпа $1.40 \pm 0.22$ в условиях волатильности, но ее эффективность снижается в трендовых рынках; действительно ли анонимизация является ключом к созданию надежных и интерпретируемых торговых агентов на основе LLM?

Преодолевая Ограничения Традиционного Анализа

Традиционное финансовое моделирование зачастую опирается на статические характеристики, игнорируя сложные взаимосвязи внутри рыночных данных. Вместо анализа динамически меняющихся зависимостей между активами, многие модели используют фиксированные показатели, такие как средние значения или стандартные отклонения, что приводит к упрощенному пониманию рыночных процессов. Данный подход не позволяет уловить тонкие сигналы и скрытые корреляции, которые могут существенно влиять на ценообразование и риски. Например, при анализе портфеля акций, использование только исторических данных о доходности без учета текущей макроэкономической ситуации или новостного фона может привести к неверной оценке потенциальных убытков. Игнорирование нелинейных зависимостей и временных изменений в корреляциях между активами ограничивает способность моделей адекватно отражать реальное поведение рынка и, следовательно, снижает эффективность инвестиционных стратегий.

Современные финансовые рынки характеризуются беспрецедентной сложностью и взаимосвязанностью активов, что требует отказа от статических моделей анализа. Традиционные подходы, основанные на фиксированных параметрах и линейных зависимостях, оказываются неспособными адекватно отразить динамично меняющиеся отношения между инструментами. Исследования показывают, что корреляции между активами не являются постоянными, а подвержены эволюции во времени, особенно в периоды высокой волатильности или под влиянием макроэкономических событий. Поэтому, для эффективного прогнозирования и управления рисками, необходимы адаптивные методы, способные улавливать и учитывать эти меняющиеся зависимости, например, с использованием алгоритмов машинного обучения и анализа временных рядов, позволяющих выявлять нелинейные взаимосвязи и предсказывать будущие изменения в структуре рынка.

Существующие методы финансового анализа часто страдают от систематических искажений, в частности, от предвзятости выжившего. Этот эффект возникает из-за того, что в статистику включаются только успешно функционирующие активы или стратегии, в то время как информация о тех, которые прекратили свое существование, игнорируется. В результате, наблюдаемые показатели доходности оказываются завышенными, создавая иллюзию большей эффективности, чем есть на самом деле. Это приводит к формированию нереалистичных ожиданий и принятию ошибочных инвестиционных решений, поскольку оценка рисков и потенциальной прибыли оказывается искаженной. В конечном итоге, стратегии, разработанные на основе таких предвзятых данных, демонстрируют неустойчивость и могут оказаться неэффективными в долгосрочной перспективе, подчеркивая необходимость критического подхода к интерпретации финансовых показателей и использования методов, учитывающих полный спектр доступной информации.

Анализ динамики вероятностей намерений показывает, что разработанная политика адаптируется к изменяющимся рыночным условиям и демонстрирует стабильную обобщающую способность на различных наборах данных.

BlindTrade: Система, Основанная на Приоритете Анонимности

Система BlindTrade представляет собой инновационную структуру, объединяющую большие языковые модели (LLM Agents), графовые нейронные сети (GNN) и политику обучения с подкреплением (RL Policy) для генерации альфа-сигнала. LLM Agents используются для анализа текстовых данных и формирования инвестиционных идей. GNN применяются для построения и анализа взаимосвязей между различными финансовыми инструментами и рыночными факторами, формируя структурированное представление знаний. RL Policy, в свою очередь, использует полученные знания для принятия торговых решений, оптимизируя стратегию с целью максимизации прибыли и минимизации рисков. Интеграция этих трех компонентов позволяет системе BlindTrade автоматически генерировать и оценивать инвестиционные гипотезы, адаптируясь к изменяющимся рыночным условиям.

Критически важным компонентом системы BlindTrade является анонимизация, предназначенная для предотвращения запоминания конкретных тикеров ценных бумаг и, как следствие, утечки данных в процессе обучения моделей. Этот процесс включает в себя замену фактических тикеров на нейтральные идентификаторы перед подачей данных в LLM-агентов и GNN. Анонимизация снижает риск переобучения модели на конкретных акциях, что повышает обобщающую способность системы и обеспечивает защиту конфиденциальной информации о торговых стратегиях. Использование анонимизированных данных позволяет обучать модели, способные выявлять закономерности и генерировать инвестиционные идеи, не зависящие от конкретных наименований ценных бумаг.

В основе системы BlindTrade лежит использование Reasoning Embeddings — векторных представлений аналитических выводов, генерируемых большой языковой моделью (LLM). Эти векторы служат для построения богатого графа знаний, где узлами являются ключевые концепции и сущности, а ребра — связи между ними, сформированные на основе LLM-анализа. Такой подход позволяет системе представлять сложные взаимосвязи между финансовыми инструментами и рыночными событиями в структурированном формате, пригодном для дальнейшей обработки графовыми нейронными сетями (GNN) и использования в процессе обучения с подкреплением (RL).

Политика обучения с подкреплением формирует веса портфеля, используя распределение Дирихле, параметры которого определяются оценками акций, полученными из оценки рыночной ситуации графовой нейронной сетью и выбранной стратегии (оборонительной, нейтральной или агрессивной) на основе статистики, полученной от большой языковой модели.

Изучение Взаимосвязей Между Акциями с Помощью Графовых Сетей

Графовая нейронная сеть (GNN) формирует динамичное представление рынка путем интеграции связей между секторами экономики с векторными представлениями, сгенерированными большой языковой моделью (LLM) на основе анализа причинно-следственных связей. Взаимосвязи между секторами, определяемые на основе отраслевой принадлежности акций, служат основой для построения графа. LLM, анализируя новостные потоки и финансовые отчеты, генерирует векторные представления (embeddings), отражающие взаимосвязи между компаниями и факторами, влияющими на их стоимость. Объединение этих двух источников информации позволяет GNN учитывать как структурные (секторальные) связи, так и семантические (причинно-следственные) факторы, формируя комплексное и адаптивное представление о динамике рынка.

Семантическая сеть внимания (SemGAT) повышает эффективность анализа связей между акциями за счет механизма фокусировки на наиболее релевантных соединениях в графе. В отличие от стандартных графовых нейронных сетей, SemGAT использует внимание для взвешивания важности каждого соединения, определяя, какие связи оказывают наибольшее влияние на представление конкретной акции. Это позволяет сети динамически адаптироваться к изменяющимся рыночным условиям и отфильтровывать нерелевантную информацию, что приводит к более точным прогнозам и улучшенному управлению портфелем. В процессе обучения SemGAT определяет значимость связей на основе семантических свойств узлов и ребер графа, что позволяет более эффективно использовать информацию о секторальной принадлежности и взаимосвязях между компаниями.

Политика обучения с подкреплением (RL) использует выходные данные графовой нейронной сети (GNN) для определения оптимальных весов портфеля, ориентируясь на переменные намерений, задающие желаемый профиль риска (защитный, нейтральный, агрессивный). В защитном режиме наблюдается высокая оборачиваемость активов — 2,9% в день, что значительно превышает показатели нейтрального режима (1,8%) и агрессивного (0,4%), отражая активную перебалансировку портфеля для снижения рисков и сохранения капитала в условиях неблагоприятной рыночной конъюнктуры. Такая стратегия подразумевает более частую продажу и покупку активов для поддержания заданного уровня риска.

Политика, обусловленная намерением, демонстрирует более высокую частоту смены активов в защитном режиме (2,9% в день) и значительные различия в максимальном весе и концентрации (эффективном N) в зависимости от выбранного намерения (критерий Краскала, p=0,000).

Подтверждение Прогностической Силы и Смягчение Искажений

Для оценки прогностической силы сигналов, генерируемых языковой моделью, был применен анализ информационного коэффициента (IC), основанный на корреляции рангов Спирмена между этими сигналами и будущей доходностью активов. Полученный коэффициент IC составил 0.015, что свидетельствует о наличии статистически значимой связи. Для подтверждения валидности полученного результата, была проведена проверка путем рандомизации прогнозов, в результате которой значение IC снизилось до 0.0004. Данное существенное снижение подтверждает, что наблюдаемая прогностическая сила не является случайной, а обусловлена именно способностью языковой модели выявлять закономерности, влияющие на будущую доходность.

В рамках разработанной системы особое внимание уделяется исключению распространенных искажений при ретроспективном тестировании. Для предотвращения ошибки опережающего тестирования, когда будущая информация неправомерно используется для оценки прошлых результатов, применяются строгие протоколы обработки данных и временной сегментации. Кроме того, для минимизации влияния эффекта выжившего, связанного с исключением из анализа компаний, прекративших свое существование, используется комплексный подход к обработке данных, включающий учет всех доступных исторических данных, даже для компаний, вышедших из состава индекса. Такая тщательная обработка позволяет получить более реалистичную и надежную оценку эффективности стратегии, исключая ложные позитивные результаты, вызванные искажениями в данных.

Система оптимизирована с использованием Дифференциального коэффициента Шарпа (DSR) в рамках политики обучения с подкреплением, что позволило приоритизировать доходность с учетом риска и максимизировать долгосрочную прибыльность. В ходе вневыборочных испытаний достигнут годовой коэффициент Шарпа в 1.40, превосходящий показатели SPY. Кроме того, система продемонстрировала кумулятивную доходность в 32.22% с начала 2025 года, а также 22.8% за расширенный период вневыборочных испытаний с 2024 по 2025 год, что значительно превышает результат SPY, составивший 6.1%. Данные показатели свидетельствуют об эффективности применяемого подхода к оптимизации и потенциале системы для достижения стабильной и высокой доходности.

Отсутствие информационного содержания в случайных предсказаниях подтверждает, что наблюдаемый эффект IC не случаен, а обусловлен обученной политикой.

Без точного определения задачи любое решение — шум. Данное исследование, представляя BlindTrade, подчеркивает необходимость строгой логики в процессе оптимизации портфеля. Авторы исходят из того, что любые алгоритмы, используемые в финансовых торгах, должны быть не просто работоспособными, но и доказуемо корректными. Подход, основанный на анонимизации данных и использовании графовых нейронных сетей (GNN), направлен на устранение проблем запоминания и предвзятости, которые часто возникают при использовании больших языковых моделей (LLM). Эффективность BlindTrade в условиях волатильности рынка демонстрирует, что строгий подход к обработке данных и интерпретируемое управление портфелем являются ключевыми факторами успеха. Как заметил Эдсгер Дейкстра: «Простота — это высшая степень совершенства».

Что дальше?

Представленная работа, хотя и демонстрирует определенный прогресс в смягчении проблем запоминания и предвзятости при использовании больших языковых моделей в финансовой торговле, не решает фундаментальную дилемму: корректность алгоритма не определяется его прибыльностью на исторических данных, а лишь доказательством его логической непротиворечивости. Успех BlindTrade в волатильных рынках, безусловно, интересен, но является лишь эмпирическим наблюдением, требующим строгого математического обоснования. Необходимо сосредоточиться на разработке формальных методов верификации, гарантирующих отсутствие скрытых зависимостей от исторических данных.

Особое внимание следует уделить проблеме неполноты данных и выживания. Анонимизация, хотя и смягчает некоторые риски, не устраняет полностью возможность предвзятости, возникающей из-за нерепрезентативной выборки. Исследование должно быть направлено на разработку моделей, устойчивых к неполноте информации и способных оценивать степень неопределенности. Интерпретируемость, заявленная как преимущество, должна быть подкреплена строгими метриками, позволяющими оценить, насколько предложенные модели действительно отражают логику принятия решений, а не являются лишь пост-рационализацией случайных событий.

В конечном итоге, истинный прогресс заключается не в создании более сложных моделей, а в разработке более простых и элегантных решений, основанных на фундаментальных принципах математики и теории информации. Попытки заменить доказательство эмпирическими наблюдениями — путь в никуда. Истинная элегантность заключается в математической чистоте, а не в краткосрочной прибыли.

Оригинал статьи: https://arxiv.org/pdf/2603.17692.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-19 18:59