Поиск прибыльных стратегий: Искусственный интеллект на службе финансов

Автор: Денис Аветисян

Новая система, основанная на больших языковых моделях, позволяет автоматизировать поиск и анализ финансовых факторов, повышая эффективность инвестиционных стратегий.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал

В рамках платформы Hubble, большая языковая модель генерирует потенциальные выражения для факторизации, используя спецификации операторов DSL, после чего эти выражения проходят валидацию в трехслойной среде AST-песочницы, оцениваются статистическим движком, а лучшие результаты используются для корректировки последующих раундов генерации, обеспечивая итеративное улучшение процесса.

Представлен Hubble — агентский фреймворк, обеспечивающий безопасное и автоматизированное обнаружение интерпретируемых финансовых факторов с гарантированной вычислительной стабильностью благодаря использованию DSL и AST-песочницы.

Поиск эффективных прогностических факторов в количественных финансах осложняется огромным пространством поиска и низким отношением сигнала к шуму. В данной работе представлена система ‘Hubble: An LLM-Driven Agentic Framework for Safe and Automated Alpha Factor Discovery’, использующая большие языковые модели (LLM) для автоматизированного поиска факторов, ограниченных специализированным языком и исполняемой средой на основе абстрактного синтаксического дерева. Эксперименты на данных 30 американских акций за 752 торговых дня показали, что предложенный подход обеспечивает вычислительную стабильность и позволяет находить интерпретируемые факторы с пиковым агрегированным баллом 0.827. Возможно ли создание полностью автономных систем для разработки и оптимизации инвестиционных стратегий на основе LLM, гарантирующих надежность и прозрачность принимаемых решений?

Ограничения Традиционного Поиска Факторов

Традиционное построение факторов в финансовом анализе исторически опиралось на интуицию и ручной отбор признаков, что представляло собой длительный и подверженный субъективным искажениям процесс. Аналитики вручную разрабатывали гипотезы о взаимосвязях между различными финансовыми показателями и будущей доходностью, затем проверяли эти гипотезы на исторических данных. Этот подход, хотя и привел к созданию некоторых успешных факторов, страдал от ограниченности человеческого восприятия и неспособности охватить весь спектр возможных комбинаций признаков. Более того, предвзятость аналитика, его личные убеждения и предпочтения, могли неосознанно влиять на выбор признаков и интерпретацию результатов, приводя к созданию факторов, которые хорошо работали в прошлом, но не обладали достаточной обобщающей способностью для будущих рыночных условий. Таким образом, традиционный подход, несмотря на свою давнюю историю, оказался неэффективным в масштабировании и адаптации к постоянно меняющемуся финансовому ландшафту.

Автоматизированные методы выявления факторов, такие как генетическое программирование, несмотря на свою привлекательность, часто демонстрируют ограниченную способность к обобщению и адаптации к изменяющимся рыночным условиям. Исследования показывают, что факторы, разработанные с использованием этих подходов, могут демонстрировать высокую эффективность на исторических данных, используемых для обучения, но терять свою прогностическую силу в новых, ранее не встречавшихся рыночных режимах. Причина кроется в переобучении — алгоритм слишком сильно подстраивается под конкретные особенности обучающей выборки, не улавливая фундаментальные закономерности, которые сохраняются в долгосрочной перспективе. Это приводит к тому, что факторы, казавшиеся перспективными, быстро теряют свою актуальность, требуя постоянной переоптимизации и снижая общую эффективность инвестиционных стратегий, основанных на автоматизированном поиске факторов.

Пространство потенциальных факторов, определяющих динамику финансовых рынков, представляется чрезвычайно обширным и сложным. Простой перебор всех возможных комбинаций характеристик, так называемый метод «грубой силы», оказывается неэффективным и практически нереализуемым из-за экспоненциального роста вычислительных затрат. Для успешного выявления значимых факторов необходимы усовершенствованные стратегии исследования, сочетающие в себе принципы оптимизации, машинного обучения и статистического анализа. Эти стратегии должны позволять не только быстро просматривать огромное количество потенциальных комбинаций, но и эффективно отсеивать нерелевантные, фокусируясь на тех, которые действительно способны объяснить и предсказать поведение рынка. В результате, разработка таких стратегий является ключевой задачей для повышения эффективности факторного анализа и создания более надежных инвестиционных моделей.

В процессе поиска оптимальных факторных структур наблюдается эволюция распределения оценок: от достижения глобального максимума в первом раунде (0.827) к увеличению дисперсии во втором, вызванного активным исследованием сложных выражений, и, наконец, к стабилизации и сходимости оценок в третьем раунде.

Использование LLM для Генерации Факторных Выражений

Использование больших языковых моделей (LLM) позволяет значительно расширить пространство поиска при генерации кандидатных факторных выражений. Традиционные методы часто ограничены предопределенными шаблонами и логикой, что сужает возможности для обнаружения новых, потенциально релевантных факторов. LLM, обученные на обширных наборах данных, способны генерировать широкий спектр выражений, включая сложные комбинации финансовых показателей и математических операций. Этот подход позволяет исследовать гораздо большее количество вариантов, чем это возможно при ручном построении или использовании жестко заданных алгоритмов, что повышает вероятность выявления факторов, способных объяснить или предсказать поведение финансовых активов. По сути, LLM действуют как генераторы гипотез, предлагая множество возможных формул, которые затем могут быть проверены и отфильтрованы с использованием традиционных методов факторного анализа.

Ограничение вывода большой языковой модели (LLM) посредством использования специализированного языка (DSL) критически важно для обеспечения корректности и применимости генерируемых факторных выражений. DSL определяет допустимый синтаксис и семантику, гарантируя, что LLM генерирует только вычислительно валидные формулы, соответствующие финансовым принципам. Это позволяет избежать генерации неверных или бессмысленных выражений, которые могли бы привести к ошибкам в моделях ценообразования или управления рисками. В частности, DSL может включать предопределенные функции, операторы и типы данных, релевантные для финансового моделирования, например, расчет доходности, дисконтирование денежных потоков или вычисление статистических показателей. Такое ограничение значительно повышает надежность и практическую ценность генерируемых факторов, позволяя автоматизировать процесс создания сложных финансовых моделей.

Метод Tree-of-Thought (ToT) предполагает структурирование процесса генерации выражений в LLM как последовательность шагов рассуждений. Вместо прямого вывода фактора, LLM генерирует несколько возможных “мыслей” (кандидатов) на каждом этапе. Затем, модель оценивает эти мысли на основе заданных критериев и выбирает наиболее перспективные для дальнейшей разработки. Этот итеративный процесс позволяет LLM создавать более сложные и обоснованные выражения, преодолевая ограничения, присущие одношаговой генерации. Применение ToT приводит к увеличению вероятности генерации валидных и релевантных факторов, поскольку модель имеет возможность исследовать различные пути решения и корректировать свою логику на основе промежуточных результатов. Эффективность ToT повышается при использовании специализированных метрик оценки, отражающих специфику предметной области, например, финансовую значимость или вычислительную сложность фактора.

Итеративный процесс поиска включает в себя получение обратной связи из предыдущих раундов, генерацию кандидатных выражений с помощью LLM, их оценку в среде выполнения и статистической обработке, а затем перегонку наиболее эффективных результатов в структурированную обратную связь для последующих итераций.

Строгая Валидация и Оценка Эффективности

Для обеспечения вычислительной безопасности и корректности генерируемых факторных выражений используется AST Sandbox — трехслойная система валидации. Первый слой проверяет синтаксическую корректность выражения, предотвращая выполнение некорректного кода. Второй слой осуществляет семантический анализ, гарантируя, что операции выполняются над допустимыми типами данных и что отсутствуют неразрешенные зависимости. Третий слой представляет собой контролируемую среду выполнения, где выражение оценивается с ограниченным набором ресурсов и данных, предотвращая бесконечные циклы, переполнение стека или другие потенциально опасные ситуации. Такая многоуровневая проверка минимизирует риск ошибок и обеспечивает надежность генерируемых факторов.

Статистическая оценочная воронка использует метрики, такие как RankIC (ранговый коэффициент корреляции) и Information Ratio (IR), для оценки прогностической силы и эффективности факторов с учетом риска. RankIC измеряет корреляцию между рангами прогнозов фактора и фактическими значениями, позволяя оценить способность фактора последовательно ранжировать активы. Information Ratio, рассчитываемый как отношение среднего избыточного дохода к стандартному отклонению этого дохода $\frac{\mu - r_f}{\sigma}$ , где μ — средняя доходность фактора, $r_f$ — безрисковая ставка, а σ — стандартное отклонение доходности, позволяет оценить эффективность фактора с поправкой на риск. Высокие значения IR указывают на более привлекательные факторы с учетом их волатильности.

Мониторинг оборачиваемости (Turnover) является критически важным этапом оценки фактора, поскольку он позволяет определить частоту торговых операций, подразумеваемую данным фактором. Высокая оборачиваемость указывает на частую переоценку активов и, как следствие, повышенные транзакционные издержки, включая комиссии брокера и спред. Низкая оборачиваемость может сигнализировать о низкой чувствительности фактора к изменениям на рынке или о его ограниченной способности генерировать торговые сигналы. При практической реализации торговой стратегии на основе фактора, необходимо учитывать компромисс между потенциальной прибыльностью и стоимостью транзакций, определяемой оборачиваемостью. Анализ оборачиваемости позволяет оптимизировать параметры стратегии для минимизации издержек и максимизации чистой прибыли.

Анализ пяти ключевых факторов (анонимизированных как asf1f\_{1}-f5f\_{5}) показал, что факторы f1f\_{1} и f2f\_{2} демонстрируют краткосрочные импульсные сигналы с годовой информационной прибылью более 1.0 и высокой оборачиваемостью (<span class="katex-eq" data-katex-display="false"> \bar{\tau} > 0.9 </span>), в то время как факторы f3f\_{3}-f5f\_{5} характеризуются более стабильными сигналами и умеренной информационной прибылью. — Анализ пяти ключевых факторов (анонимизированных как asf1f\_{1}-f5f\_{5}) показал, что факторы f1f\_{1} и f2f\_{2} демонстрируют краткосрочные импульсные сигналы с годовой информационной прибылью более 1.0 и высокой оборачиваемостью ( $\bar{\tau} > 0.9$ ), в то время как факторы f3f\_{3}-f5f\_{5} характеризуются более стабильными сигналами и умеренной информационной прибылью.

Hubble: Автоматизированная Система Поиска Факторов

Фреймворк Hubble объединяет генерацию факторов на основе больших языковых моделей (LLM) с детерминированными механизмами защиты и строгой статистической линией оценки для систематического поиска факторов. Генерация факторов осуществляется LLM, в то время как детерминированные защиты предотвращают создание недействительных или неопределенных выражений. Строгая оценка включает в себя проверку синтаксиса, семантическую валидацию и статистический анализ производительности факторов на исторических данных, обеспечивая надежность и релевантность обнаруженных закономерностей. Этот комплексный подход позволяет автоматически выявлять потенциальные факторы, которые могут быть использованы в количественных стратегиях.

Система Hubble использует циклы эволюционной обратной связи для постоянного улучшения процесса генерации факторов. В рамках этой системы, производительность ранее сгенерированных факторов оценивается, и полученные данные используются для корректировки параметров языковой модели (LLM). Этот процесс позволяет LLM адаптироваться и генерировать факторы, демонстрирующие более высокую эффективность и соответствие заданным критериям. Постоянная оптимизация LLM, основанная на результатах оценки, обеспечивает непрерывное повышение качества и релевантности генерируемых факторов.

В ходе экспериментов система продемонстрировала 100% вычислительную стабильность во всех запусках. Сгенерированные факторы, рассчитанные на панели из 30 американских акций за 752 торговых дня, показали годовую доходность, измеренную коэффициентом Шарпа (Information Ratio), превышающую 1.0. Это указывает на эффективность системы в выявлении статистически значимых и прибыльных факторов, при сохранении надежности и воспроизводимости результатов.

Коэффициент успешной валидации сгенерированных выражений достиг 97.3%, что свидетельствует о высокой надежности конвейера валидации. Данный показатель отражает способность системы отсеивать неработоспособные или ошибочные факторы на этапе проверки перед включением в дальнейший анализ. Высокий процент успешной валидации указывает на эффективную работу механизмов проверки синтаксиса, семантической корректности и вычислительной стабильности, что критически важно для обеспечения надежности и воспроизводимости результатов факторного анализа.

В ходе трех раундов экспериментов системой было обработано 122 уникальных кандидатов в факторы. Этот объем включает в себя все сгенерированные LLM выражения, прошедшие через детерминированные проверки и статистическую оценку. Обработка каждого фактора включала в себя вычисление его производительности на панели из 30 американских акций за 752 торговых дня, с целью определения его потенциальной прибыльности и устойчивости. Итоговое количество обработанных факторов отражает масштаб автоматизированного процесса обнаружения факторов, реализованного в системе Hubble.

Постепенное улучшение процента успешных формул (OK rate) с 93% в первом раунде до 100% в последующих, при стабильном количестве уникальных кандидатов (около 40), подтверждает эффективность механизма обратной связи в передаче ограничений DSL языку LLM.

Масштабируемость и Перспективы Развития

Разработанная система демонстрирует высокую адаптивность и потенциал для применения в различных финансовых сферах. Автоматизированный процесс генерации и оценки факторов, лежащий в основе системы, может быть эффективно использован для анализа не только текущих активов, но и других классов, включая валютные пары, сырьевые товары и даже криптовалюты. Ключевым преимуществом является возможность масштабирования без значительных изменений в архитектуре, что позволяет быстро адаптировать систему к новым рынкам и условиям. Подобная гибкость позволяет создавать разнообразные торговые стратегии и оперативно реагировать на изменения в рыночной конъюнктуре, обеспечивая устойчивость и долгосрочную эффективность инвестиционных портфелей.

Расширение предметно-ориентированного языка (DSL) открывает значительные возможности для повышения выразительности языковой модели и, как следствие, разнообразия генерируемых факторов. Добавление новых операторов и функциональных возможностей позволит модели создавать более сложные и нюансированные стратегии, учитывая широкий спектр рыночных условий и взаимодействий. Более богатый DSL позволит задавать более точные и детализированные правила для формирования факторов, что потенциально приведет к выявлению скрытых закономерностей и повышению эффективности инвестиционных стратегий. Это не только расширит спектр доступных факторов, но и позволит модели адаптироваться к изменяющимся рыночным реалиям, генерируя более устойчивые и надежные сигналы для принятия инвестиционных решений.

Внедрение регулярного исследования, основанного на принципах AlphaAgent, представляется перспективным подходом к решению проблемы угасания альфа-факторов и повышению устойчивости всей библиотеки факторов. Суть данного подхода заключается в систематическом, но контролируемом исследовании новых комбинаций признаков и стратегий, что позволяет избежать переобучения на исторических данных и адаптироваться к меняющимся рыночным условиям. Регуляризация в процессе исследования способствует отсеву неперспективных факторов и концентрации на наиболее стабильных и надежных сигналах. В результате, библиотека факторов становится более устойчивой к изменениям на рынке, сохраняя свою эффективность в долгосрочной перспективе и обеспечивая стабильную генерацию инвестиционных идей.

Представленная работа демонстрирует стремление к упрощению сложного. Hubble, как система автоматического поиска финансовых факторов, воплощает идею о том, что истинная сила заключается не в количестве параметров, а в их ясности и надёжности. Как однажды заметил Кен Томпсон: «Простота — это высшая степень совершенства». В контексте Hubble, эта простота проявляется в использовании DSL и AST sandbox для обеспечения вычислительной стабильности, что позволяет системе генерировать интерпретируемые факторы без риска непредсказуемых ошибок. Подобный подход к автоматизации, ориентированный на предсказуемость и прозрачность, является отражением стремления к элегантности в решении сложных задач.

Что Дальше?

Представленная работа демонстрирует, что автоматизированный поиск финансовых факторов с использованием больших языковых моделей возможен, и даже достижим с сохранением вычислительной стабильности. Однако, следует признать: сама стабильность — лишь необходимое, но недостаточное условие. Важно понимать, что обнаруженный фактор — это не истина в последней инстанции, а лишь закономерность, выуженная из конкретного набора данных. Проблема «переобучения» остаётся актуальной, и требует не простого увеличения объема данных, а принципиально новых подходов к валидации и обобщению.

Следующим шагом видится не столько усложнение архитектуры системы, сколько её упрощение. Вместо добавления новых слоёв абстракции, необходимо сосредоточиться на очистке существующего кода, отбрасывая всё лишнее. Цель — не создать универсальный алгоритм, а построить минимально достаточную систему, способную выявлять действительно значимые факторы, а не просто шум. Искать следует не в сложности, а в ясности.

Наконец, стоит задуматься о природе самой «альфы». Является ли она чем-то объективным, существующим вне человеческого восприятия, или же это всего лишь иллюзия, порождённая нашими когнитивными искажениями? Ответ на этот вопрос, возможно, лежит за пределами компетенции даже самых продвинутых языковых моделей. И в этом — парадоксальная красота науки.

Оригинал статьи: https://arxiv.org/pdf/2604.09601.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-14 12:54