Финансовый интеллект: Новая эра языковых моделей

Автор: Денис Аветисян


В статье представлена QianfanHuijin — серия больших языковых моделей, разработанных специально для финансовой сферы и демонстрирующих превосходные результаты.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Бесплатный Телеграм канал
Многоэтапная схема обучения QianfanHuijin демонстрирует комплексный подход к оптимизации модели, позволяющий последовательно совершенствовать её возможности на различных стадиях процесса.
Многоэтапная схема обучения QianfanHuijin демонстрирует комплексный подход к оптимизации модели, позволяющий последовательно совершенствовать её возможности на различных стадиях процесса.

Предлагается инновационный многоступенчатый подход к обучению, включающий непрерывное предварительное обучение, прогрессивную постобработку и синтез данных для повышения финансовых рассуждений.

Несмотря на значительный прогресс в области больших языковых моделей, адаптация их к специфическим требованиям финансовой индустрии остается сложной задачей. В настоящем техническом отчете, ‘QianfanHuijin Technical Report: A Novel Multi-Stage Training Paradigm for Finance Industrial LLMs’, представлен QianfanHuijin — финансовый домен LLM, разработанный с использованием нового многоступенчатого подхода к обучению. Предложенная методика, включающая непрерывное предварительное обучение и прогрессивную постобработку с акцентом на финансовое рассуждение и агентивность, демонстрирует превосходные результаты на ключевых бенчмарках. Может ли данная стратегия стать стандартом для создания специализированных LLM в различных отраслях промышленности?


Фундамент финансовой экспертизы: преодоление ограничений языковых моделей

Традиционные языковые модели, несмотря на впечатляющие успехи в обработке естественного языка, зачастую демонстрируют недостаточную компетентность при решении специализированных финансовых задач. Отсутствие глубокого понимания финансовых концепций, рыночных механизмов и специфической терминологии приводит к неточностям в анализе данных, ошибочным прогнозам и, как следствие, к неверным решениям. Модели, обученные на общих корпусах текстов, не способны эффективно интерпретировать финансовую отчетность, оценивать риски или выявлять закономерности, критически важные для успешного инвестирования и управления финансами. Эта неспособность обусловлена тем, что финансовая сфера требует не только лингвистических навыков, но и специализированных знаний, которые стандартные языковые модели просто не имеют в своём арсенале.

Для преодоления ограничений традиционных языковых моделей в сфере финансов, применяется двухэтапный подход непрерывного предварительного обучения (CPT), начинающийся с целенаправленной инъекции финансовых знаний. Этот этап подразумевает насыщение модели обширным объемом структурированной информации, охватывающей финансовую терминологию, принципы бухгалтерского учета, экономические показатели и исторические данные. В ходе этого процесса модель не просто запоминает факты, но и формирует взаимосвязи между ними, создавая прочную базу для понимания сложных финансовых концепций. Такой подход позволяет модели эффективно обрабатывать и интерпретировать финансовые тексты, выявлять закономерности и делать обоснованные прогнозы, что является необходимым условием для выполнения специализированных финансовых задач.

Первичный этап обучения модели, заключающийся в целенаправленном внедрении финансовых знаний, позволяет сформировать её базовую компетентность в данной области. Этот процесс не просто насыщает модель информацией, но и создает необходимый контекст для дальнейшего совершенствования. По сути, модель преобразуется из общего языкового инструмента в специалиста, способного понимать нюансы финансовой сферы, что является критически важным для последующей более глубокой проработки и повышения её способности к сложному анализу и прогнозированию. Без этой фундаментальной базы дальнейшее обучение было бы значительно менее эффективным и привело бы к менее точным результатам.

После начального этапа формирования базовых финансовых знаний, происходит углубление экспертизы модели посредством этапа повышения финансовых возможностей. Этот процесс не ограничивается простым накоплением информации, а направлен на развитие способности к сложному анализу, прогнозированию и принятию решений в условиях неопределенности. Модель обучается распознавать закономерности в финансовых данных, оценивать риски и возможности, а также учитывать различные факторы, влияющие на финансовые рынки. Данный этап позволяет перейти от простого понимания финансовых концепций к активному применению этих знаний для решения практических задач и выполнения сложных расчетов, что критически важно для подготовки модели к продвинутым формам финансового мышления и обоснованным выводам.

Многоступенчатый конвейер постобучения: от рассуждений к сотрудничеству

В основе нашего подхода лежит многоэтапный конвейер постобучения, разработанный для систематического улучшения способностей модели к рассуждениям и совместной работе. Этот конвейер состоит из последовательных этапов, каждый из которых направлен на конкретный аспект улучшения производительности. Он позволяет перейти от базового понимания языка к более сложным когнитивным функциям, таким как логический вывод и совместное решение задач. Систематическая структура конвейера обеспечивает контролируемое улучшение ключевых навыков, позволяя добиться более надежных и точных результатов в задачах, требующих рассуждений и сотрудничества.

Первичная настройка модели осуществляется посредством контролируемого обучения (Supervised Fine-Tuning, SFT), направленного на формирование базового понимания языка и контекста. Затем следует этап обучения с подкреплением, ориентированный на развитие логического мышления и точности (Reasoning RL). На этом этапе модель обучается не просто распознавать закономерности, а последовательно и аргументированно выстраивать цепочки рассуждений, что позволяет ей более эффективно решать задачи, требующие аналитических способностей и точного следования логике.

Этап обучения с подкреплением, ориентированный на агентов (Agentic RL), наделяет модель способностью к совместной работе с инструментами, позволяя ей использовать внешние ресурсы для решения задач и повышения точности ответов. Последующий этап, общее обучение с подкреплением (General RL), выполняет всестороннюю оптимизацию модели и обеспечивает её соответствие заданным критериям и целям, корректируя поведение и улучшая общую производительность в различных сценариях. Комбинация этих двух этапов позволяет не только расширить функциональные возможности модели за счет интеграции с инструментами, но и гарантировать её надежность и эффективность в процессе работы.

В отличие от моделей, основанных на простом распознавании закономерностей, данный конвейер направлен на формирование способности к подлинному финансовому мышлению. Это достигается путем последовательного обучения модели не только языковым конструкциям, но и принципам логического анализа и вывода, что позволяет ей обрабатывать финансовые данные и генерировать обоснованные решения, а не просто воспроизводить статистические зависимости. Обучение включает в себя этапы, нацеленные на развитие навыков рассуждения и сотрудничества с инструментами для комплексного анализа финансовой информации.

Эта схема демонстрирует процесс очистки и фильтрации данных, необходимый для повышения их качества и пригодности для анализа.
Эта схема демонстрирует процесс очистки и фильтрации данных, необходимый для повышения их качества и пригодности для анализа.

Строгая валидация: оценка финансового интеллекта

Для подтверждения своей эффективности модель QianfanHuijin проходит оценку на основе общепринятых отраслевых бенчмарков, включающих FinanceIQ, FLAME-Cer, FinQA и Financial Reasoning. Использование этих комплексных наборов данных позволяет провести объективное сравнение с другими моделями в области финансовых задач. Бенчмарки охватывают широкий спектр сценариев, от понимания финансовых текстов до логического анализа и решения количественных задач, что обеспечивает всестороннюю оценку возможностей модели в реальных условиях.

Модель QianfanHuijin продемонстрировала результат в 94.43 балла по бенчмарку FinanceIQ, что превосходит показатели других протестированных моделей на данном этапе. FinanceIQ представляет собой комплексный набор задач, предназначенный для оценки способности модели к финансовому анализу и рассуждениям. Полученный результат подтверждает высокую эффективность QianfanHuijin в решении сложных финансовых задач, оцениваемых данным бенчмарком, и указывает на ее превосходство над существующими аналогами в данной области.

При оценке на бенчмарке FLAME-Cer, модель QianfanHuijin-70B продемонстрировала результат в 89.59 балла. Этот показатель подтверждает высокую эффективность модели в задачах, требующих понимания и анализа финансового текста, и свидетельствует о ее превосходстве над другими моделями в данной области. FLAME-Cer специализируется на оценке способностей модели к решению сложных финансовых вопросов, требующих рассуждений и логического анализа.

В ходе оценки на бенчмарке FinQA модель QianfanHuijin продемонстрировала превосходство над моделью DeepSeek-R1, набрав 77.1 балла против 65.5 баллов соответственно. Данный результат подтверждает более высокую способность QianfanHuijin к решению задач финансового анализа и ответам на вопросы, требующие понимания финансовой информации, по сравнению с DeepSeek-R1 в рамках данного набора данных.

Результаты комплексного тестирования модели QianfanHuijin на бенчмарках FinanceIQ, FLAME-Cer и FinQA подтверждают ее высокую производительность в решении различных финансовых задач. Модель демонстрирует превосходные результаты, превосходя аналогичные системы по ключевым показателям: 94.43 балла на FinanceIQ, 89.59 балла на FLAME-Cer и 77.1 балла на FinQA, что значительно выше, чем у DeepSeek-R1 (65.5 баллов на FinQA). Эти данные свидетельствуют о способности модели эффективно обрабатывать и анализировать финансовую информацию, что делает ее перспективным инструментом для автоматизации и оптимизации финансовых процессов.

Метрики FinanceIQ позволяют комплексно оценить финансовое состояние и выявить ключевые области для улучшения.
Метрики FinanceIQ позволяют комплексно оценить финансовое состояние и выявить ключевые области для улучшения.

Решение проблем с данными и совершенствование сигналов вознаграждения

В условиях ограниченности данных в сложных финансовых сценариях, применение методов синтеза данных становится необходимым инструментом для расширения обучающих выборок. Данный подход позволяет генерировать реалистичные, но искусственные данные, имитирующие реальные финансовые операции и рыночные условия. Это особенно важно при обучении моделей машинного обучения, которым требуется большое количество данных для достижения высокой точности и надежности. Использование синтеза данных позволяет преодолеть проблему дефицита информации, повысить устойчивость моделей к различным рыночным ситуациям и улучшить их способность к обобщению, что в конечном итоге способствует более эффективному принятию финансовых решений.

Разработанная структура контролируемого синтеза инструкций (CIS-F) призвана решить ключевые проблемы, связанные с недостаточным разнообразием, сложностью и точностью обучающих данных. Традиционные наборы инструкций часто не охватывают весь спектр возможных финансовых сценариев и не содержат достаточной детализации для эффективного обучения моделей. CIS-F позволяет целенаправленно генерировать новые инструкции, контролируя их сложность и специфику, что значительно расширяет возможности обучения и повышает способность модели адаптироваться к различным рыночным условиям. В отличие от случайной генерации данных, CIS-F обеспечивает создание инструкций, релевантных конкретным бизнес-задачам, что ведет к более точным и надежным результатам при решении сложных финансовых задач.

Для повышения точности обучения с подкреплением разработана модель двойной верификации, объединяющая правила, основанные на экспертных знаниях, и возможности больших языковых моделей. Этот подход позволяет более тщательно оценивать действия агента, выявляя как очевидные ошибки, так и тонкие нюансы, которые могут быть упущены при использовании только одного метода верификации. Сочетание жесткой логики правил с гибкостью и пониманием контекста, присущими LLM, обеспечивает формирование более точных и надежных сигналов вознаграждения, что в свою очередь способствует более эффективному обучению и повышению производительности модели в реальных финансовых сценариях. Такая гибридная система позволяет не только максимизировать прибыль, но и минимизировать риски, связанные с неверными решениями.

Результаты модели демонстрируют значительную эффективность в улучшении ключевых показателей бизнеса. В частности, зафиксировано впечатляющее снижение темпов роста не-чистой прибыли на 92.68%, что существенно превосходит показатель роста чистой прибыли в 56.89%. Данный результат указывает на способность модели оптимизировать операционную деятельность и эффективно управлять расходами, приводя к более устойчивому и прибыльному росту. Превышение улучшения показателя не-чистой прибыли над чистой прибылью подчеркивает, что модель не просто увеличивает общую прибыль, но и укрепляет базовую финансовую устойчивость предприятия за счет повышения эффективности основных бизнес-процессов.

Анализ финансовых показателей выявил, что 11.67% чистой прибыли формируется за счет нерегулярных поступлений и выплат. Данный показатель свидетельствует об умеренном влиянии разовых факторов на общую прибыльность компании. Хотя такие поступления могут оказывать положительное влияние в краткосрочной перспективе, их непостоянство требует осторожного подхода к оценке устойчивости финансовых результатов. В отличие от регулярной прибыли, формирующейся в результате основной деятельности, нерегулярная прибыль может быть подвержена значительным колебаниям, что необходимо учитывать при долгосрочном планировании и принятии инвестиционных решений. Таким образом, умеренное влияние разовых факторов на чистую прибыль позволяет говорить об относительно стабильной финансовой ситуации, однако требует внимательного мониторинга и анализа.

Комплекс применённых методик значительно повышает устойчивость и эффективность моделей в реальных финансовых приложениях. Синтез данных, направленный на преодоление дефицита информации в сложных сценариях, в сочетании с фреймворком CIS-F, обеспечивающим разнообразие и точность инструкций, позволяет моделям адаптироваться к широкому спектру рыночных условий. Особую роль играет двойная система верификации вознаграждений, объединяющая правила, основанные на экспертных знаниях, и возможности больших языковых моделей, что обеспечивает более точную оценку эффективности принимаемых решений. В результате, модели демонстрируют повышенную способность к обобщению и прогнозированию, что критически важно для достижения стабильных результатов в динамичной финансовой среде и минимизации рисков.

Данный рабочий процесс синтеза данных позволяет создавать и обрабатывать данные для обучения и оценки моделей машинного обучения.
Данный рабочий процесс синтеза данных позволяет создавать и обрабатывать данные для обучения и оценки моделей машинного обучения.

Исследование, представленное в данной работе, демонстрирует, что создание эффективной системы для финансовой сферы требует не просто набора алгоритмов, но и глубокого понимания взаимосвязей между компонентами. Авторы подчеркивают важность поэтапного обучения и синтеза данных, что позволяет модели адаптироваться к специфике предметной области и достигать более высокой точности в финансовых рассуждениях. Как заметил Роберт Тарьян: «Структура определяет поведение». Этот принцип находит свое отражение в QianfanHuijin, где тщательно продуманная архитектура и методология обучения позволяют модели демонстрировать впечатляющие результаты, превосходя существующие аналоги в задачах, связанных с финансовой аналитикой и прогнозированием.

Что Дальше?

Представленная работа, безусловно, демонстрирует прогресс в создании специализированных языковых моделей для финансовой сферы. Однако, кажущаяся сложность предложенного многоступенчатого подхода вызывает естественный вопрос: не является ли элегантность решения признаком его истинной силы? Успех, достигаемый за счет последовательного добавления этапов, может оказаться хрупким. В конечном итоге, стабильность системы определяется не количеством её компонентов, а их взаимосвязью и внутренней согласованностью.

Особое внимание следует уделить не только синтезу данных, но и качеству их верификации. Модель, обученная на искусственно созданных данных, рискует унаследовать скрытые предубеждения или упрощенные представления о реальности. Реальный финансовый мир редко бывает логичным и предсказуемым; способность модели к адаптации и обнаружению аномалий остается критически важной.

Будущие исследования, вероятно, будут сосредоточены на поиске более компактных и эффективных архитектур, способных достигать сопоставимых результатов. Простота — не признак примитивности, а признак глубокого понимания. Задача заключается не в создании максимально сложной модели, а в построении системы, способной к самообучению и эволюции, подобно живому организму.


Оригинал статьи: https://arxiv.org/pdf/2512.24314.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-01-01 17:02