Автор: Денис Аветисян
Новое исследование показывает, что качество и тщательно подобранные данные играют решающую роль в достижении высокой производительности моделей искусственного интеллекта в финансовой сфере.

В статье представлены новые открытые наборы данных и модели, превосходящие существующие аналоги, и продемонстрирована важность обучения с учетом сложности задач.
Несмотря на впечатляющие общие возможности больших языковых моделей (LLM), их применение в финансовой сфере сталкивается с рядом трудностей, связанных со специфической терминологией и требованием к точности расчетов. В работе ‘Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training’ проведено исследование, показывающее, что в специализированных областях качество и сложность данных для обучения играют определяющую роль в достижении высокой производительности. Ключевым результатом стало создание новых датасетов — ODA-Fin-SFT-318k и ODA-Fin-RL-12k — и моделей, превосходящих существующие открытые аналоги по ряду финансовых бенчмарков. Какие еще стратегии курации данных позволят раскрыть потенциал LLM для решения сложных задач в области финансов и инвестиций?
Основы финансового интеллекта: Данные как фундамент
Для достижения надёжного финансового анализа с помощью больших языковых моделей (LLM) необходимы наборы данных, превосходящие ограничения существующих эталонов. Традиционные бенчмарки часто оказываются недостаточными для обучения моделей, способных к сложному финансовому рассуждению и принятию обоснованных решений. Ограничения в объеме, разнообразии и качестве данных приводят к тому, что LLM испытывают трудности с пониманием нюансов финансовых рынков, интерпретацией отчетов и прогнозированием тенденций. Поэтому, создание специализированных наборов данных, тщательно отобранных и верифицированных, является ключевым шагом к разработке финансовых моделей, которые можно доверять и использовать для решения реальных задач, а также для обеспечения прозрачности и надежности финансовых прогнозов.
Инициатива OpenDataArena направлена на преодоление ограничений существующих наборов данных для обучения больших языковых моделей в сфере финансов. В рамках этой работы созданы специализированные высококачественные наборы данных, включая ODA-Fin-SFT-318k, содержащий 318 тысяч примеров, и ODA-Fin-RL-12k, состоящий из 12 тысяч примеров. Эти наборы данных, созданные с акцентом на data-centric AI, призваны обеспечить более надежную и точную работу финансовых моделей, предоставляя им структурированную и проверенную информацию для обучения и анализа. Разработка ODA-Fin-SFT-318k и ODA-Fin-RL-12k представляет собой важный шаг к созданию финансовых инструментов, способных к более глубокому и осмысленному взаимодействию с финансовыми данными.
Создание наборов данных ODA-Fin-SFT-318k и ODA-Fin-RL-12k представляет собой важный прорыв в области разработки надежных и проверяемых финансовых моделей. Эти специализированные наборы, включающие 318 тысяч и 12 тысяч тщательно отобранных примеров соответственно, призваны преодолеть ограничения существующих эталонов и обеспечить более точные и обоснованные финансовые прогнозы. Акцент на качестве и происхождении данных позволяет создавать модели, способные не только эффективно решать поставленные задачи, но и предоставлять прозрачные и верифицируемые результаты, что особенно важно в критически важных финансовых приложениях. Разработка подобных ресурсов открывает новые возможности для применения искусственного интеллекта в финансовой сфере, способствуя повышению доверия к автоматизированным системам анализа и принятия решений.
Обеспечение целостности и достоверности финансовых наборов данных требует строгой прослеживаемости происхождения данных и процессов верификации. Каждый элемент информации в наборах ODA-Fin-SFT-318k и ODA-Fin-RL-12k подвергается тщательному анализу, направленному на выявление и устранение потенциальных ошибок или несоответствий. Происхождение каждого образца данных документируется, что позволяет отследить его путь от первоисточника до конечного набора. Такой подход не только гарантирует качество данных, но и обеспечивает возможность воспроизведения результатов, полученных на их основе, что критически важно для построения надежных и верифицируемых финансовых моделей, способных к разумным финансовым рассуждениям.

Искусство дистилляции знаний: От данных к интеллекту
Процесс дистилляции данных преобразует необработанные финансовые данные в структурированный формат, пригодный для обучения языковых моделей. Исходные данные, которые могут включать текстовые отчеты, таблицы и новостные статьи, анализируются и перефразируются в виде пар «инструкция-ответ». Это предполагает создание четких инструкций, описывающих конкретную финансовую задачу (например, анализ прибыльности компании, оценка рисков инвестиций) и соответствующих ответов, основанных на исходных данных. Результатом является набор высококачественных обучающих данных, которые позволяют модели не просто понимать финансовую информацию, но и следовать инструкциям для решения конкретных задач, что значительно повышает ее эффективность и точность.
Для повышения качества и аналитических способностей дистиллированных финансовых данных используется генерация рассуждений (Chain-of-Thought, CoT) с применением больших языковых моделей, таких как Qwen3-235B-A22B-Thinking. Данный подход позволяет модели не просто выдавать ответы, но и демонстрировать ход мысли, приводящий к решению. Qwen3-235B-A22B-Thinking генерирует пошаговые объяснения для каждого ответа, что значительно улучшает понимание и интерпретацию данных, а также способствует более точному обучению целевой модели. Процесс CoT-генерации включает в себя создание обучающих примеров, в которых каждый ответ сопровождается детальным описанием логических шагов, необходимых для его получения.
Процесс контролируемой тонкой настройки (Supervised Fine-Tuning) использует модель Qwen3-8B в качестве отправной точки для адаптации к специфике финансового языка и логики рассуждений. Данный метод предполагает обучение модели на размеченном наборе данных, содержащем финансовую информацию и соответствующие ответы или объяснения. В ходе обучения веса Qwen3-8B корректируются таким образом, чтобы максимизировать вероятность правильного ответа на финансовые запросы, что позволяет модели лучше понимать и обрабатывать сложные финансовые концепции, терминологию и контекст. Это приводит к повышению точности и надежности модели при решении задач, связанных с финансовым анализом, прогнозированием и принятием решений.
Семантическая дедупликация является ключевым этапом подготовки данных для обучения языковых моделей, направленным на повышение эффективности и снижение избыточности. Процесс включает в себя идентификацию и удаление семантически эквивалентных примеров из обучающего набора. Это достигается путем анализа смыслового содержания данных, а не только их лексического сходства. Удаление дубликатов позволяет сократить объем данных, необходимых для достижения целевой производительности модели, снизить вычислительные затраты и предотвратить переобучение, особенно в задачах, где повторение информации может исказить результаты обучения. Применение семантической дедупликации особенно важно при работе с большими объемами данных, характерными для финансовых приложений, где разнообразие и уникальность информации критичны для обеспечения надежности и точности модели.

Обучение через опыт: Укрепление финансового мышления
Обучение с подкреплением позволяет усовершенствовать финансовое мышление большой языковой модели (LLM) посредством оптимизации ее поведения на основе сигналов вознаграждения. В данном процессе, модель получает положительное вознаграждение за правильные и обоснованные финансовые ответы, и отрицательное — за неверные или нелогичные. Этот механизм позволяет LLM постепенно корректировать свои стратегии принятия решений, улучшая точность и надежность финансовых прогнозов и аналитики. Эффективность обучения напрямую зависит от качества сигналов вознаграждения и алгоритма оптимизации, определяющих, как модель адаптирует свое поведение для достижения максимальной «выгоды» в заданном финансовом контексте.
В системе используется модель CompassVerifier-7B в качестве инструмента оценки корректности генерируемых финансовых ответов. Данная модель функционирует как reward model и верификатор, предоставляя числовой сигнал, отражающий качество ответа. Этот сигнал используется в процессе обучения с подкреплением для оптимизации поведения языковой модели. CompassVerifier-7B оценивает не только синтаксическую правильность ответа, но и его соответствие финансовой логике и фактам, что позволяет повысить надежность и точность генерируемых финансовых решений.
Алгоритм Group Relative Policy Optimization (GRPO) повышает эффективность и стабильность процесса обучения с подкреплением за счет использования групповой относительной оптимизации. В отличие от традиционных алгоритмов, GRPO оценивает политику модели относительно группы других политик, что позволяет снизить дисперсию оценок и ускорить сходимость. Это достигается путем вычисления относительного преимущества политики по сравнению с базовой линией, сформированной из производительности группы, а не абсолютного значения вознаграждения. В результате GRPO демонстрирует повышенную устойчивость к шуму в сигналах вознаграждения и обеспечивает более надежное обучение, особенно в сложных средах, требующих точной финансовой и числовой аргументации.
Процесс обучения с подкреплением применяется как к задачам финансового рассуждения (Financial Reasoning), так и к задачам численного рассуждения (Numerical Reasoning). Это позволяет значительно улучшить возможности модели в ключевых финансовых областях, включая анализ финансовых отчетов, прогнозирование рыночных тенденций и оценку инвестиционных рисков. Применение единого подхода к обоим типам рассуждений способствует более целостному и эффективному развитию финансовых компетенций модели, обеспечивая ее способность решать широкий спектр финансовых задач.

Подтверждение интеллекта: Бенчмарки и горизонты будущего
Для подтверждения способности модели к финансовому мышлению проводилась валидация с использованием специализированных бенчмарков, таких как FinEval и Finova. Эти тесты позволили оценить, насколько эффективно система справляется со сложными финансовыми задачами, требующими анализа данных, понимания экономических принципов и принятия обоснованных решений. Успешное прохождение этих тестов демонстрирует, что модель способна не просто обрабатывать числовую информацию, но и интерпретировать её в контексте финансовых операций, что открывает перспективы для автоматизации сложных финансовых процессов и повышения их точности.
Исследования показали, что модель демонстрирует значительное улучшение навыков численного рассуждения в финансовой сфере, что подтверждается результатами тестирования на наборе данных FinQA. Способность точно обрабатывать и анализировать числовую информацию, представленную в финансовых задачах, является ключевым показателем эффективности подобных систем. Успехи в данной области позволяют модели решать сложные финансовые задачи, требующие не только понимания концепций, но и точного математического анализа. Повышение численного рассуждения открывает перспективы для создания более надежных и точных инструментов для автоматизации финансовых процессов и принятия обоснованных инвестиционных решений.
Исследовательская группа продемонстрировала передовые результаты, достигнув средней точности в 74.6% при тестировании модели ODA-Fin-RL-8B на девяти различных эталонных наборах данных. Этот показатель свидетельствует о значительном прогрессе в области финансовых языковых моделей и подтверждает эффективность предложенного подхода к обучению с подкреплением. Достигнутая точность позволяет модели эффективно решать сложные финансовые задачи, включая анализ финансовых отчетов, прогнозирование рыночных тенденций и оценку рисков, что открывает новые возможности для автоматизации и оптимизации финансовых процессов.
В ходе тестирования модель продемонстрировала выдающиеся результаты на ключевых бенчмарках. В частности, достигнута точность в 89.3% на наборе данных TaTQA, что превосходит показатели модели Qwen3-32B на 4.2 процентных пункта. Кроме того, на бенчмарке Finova модель показала точность в 54.6%, что делает её лидером среди моделей с 8 миллиардами параметров. Эти результаты свидетельствуют о значительном прогрессе в области разработки финансовых ИИ-систем и подтверждают эффективность предложенных подходов к обучению.
Успешное применение разработанных методов открывает перспективные возможности для создания более надежных и эффективных систем искусственного интеллекта в финансовой сфере. Достигнутые результаты демонстрируют потенциал для автоматизации сложных финансовых задач, начиная от анализа инвестиционных стратегий и оценки рисков, и заканчивая прогнозированием рыночных тенденций и персонализированным финансовым консультированием. Разработанные подходы, основанные на обучении с подкреплением и тщательной валидации на специализированных бенчмарках, позволяют создавать модели, способные к более точному и обоснованному принятию решений в условиях неопределенности, что критически важно для финансовой стабильности и успеха. Внедрение подобных технологий может значительно повысить эффективность финансовых операций, снизить затраты и предоставить пользователям более качественные и доступные финансовые услуги.
В дальнейшем исследователи планируют существенно расширить набор используемых бенчмарков для оценки финансовых моделей, стремясь к более полному и всестороннему тестированию их возможностей. Особое внимание будет уделено разработке и применению передовых стратегий обучения с подкреплением, позволяющих модели не только успешно решать текущие задачи, но и адаптироваться к новым, ранее не встречавшимся финансовым сценариям. Это включает в себя эксперименты с более сложными алгоритмами и архитектурами, направленными на повышение способности модели к обобщению и принятию обоснованных решений в условиях неопределенности, что в конечном итоге приведет к созданию более надежных и эффективных систем искусственного интеллекта для финансовой сферы.
Исследование демонстрирует, что значимость высококачественных данных в обучении финансовых языковых моделей превосходит размер самой модели. Это подтверждает идею о том, что системы развиваются, а не конструируются. Как бы то ни было, каждое внедрение — это лишь небольшая часть надвигающегося коллапса, а качество данных — это пророчество о будущей надежности. В этой связи, слова Анри Пуанкаре: «Наука не состоит из ряда истин, окончательно установленных и непоколебимых, но из совокупности более или менее вероятных мнений». Эта мысль перекликается с тем, что в мире данных абсолютной уверенности не существует, и даже тщательно отобранные данные могут содержать скрытые погрешности, влияющие на результаты.
Что же дальше?
Представленная работа, фокусируясь на качестве данных, неизбежно поднимает вопрос о природе самой “интеллектуальности” в финансовых моделях. Масштабируемость — лишь слово, которым оправдывают усложнение, но истинная ценность, кажется, кроется не в размере сети, а в тонкости курации входных данных. Стремление к “сильному искусственному интеллекту” в финансах может оказаться иллюзией, если пренебрегать фундаментальной хрупкостью данных, на которых он строится. Каждый архитектурный выбор — это пророчество о будущей ошибке, а идеальная архитектура — миф, необходимый, чтобы мы не сошли с ума.
Проблема, однако, не ограничивается лишь качеством существующих наборов данных. Очевидно, что существующие открытые источники не отражают всей сложности и нюансов финансового мира. Необходимо переосмыслить сам процесс создания данных, сместив акцент с простого сбора информации на формирование репрезентативных, сбалансированных и тщательно проверенных наборов. Всё, что оптимизировано, однажды потеряет гибкость, и будущее финансовых моделей, вероятно, лежит в адаптивности и способности к обучению на меняющемся потоке данных.
В конечном счете, системы — это не инструменты, а экосистемы. Их нельзя построить, только вырастить. Истинный прогресс в области применения больших языковых моделей в финансах, возможно, потребует не столько увеличения вычислительных мощностей, сколько глубокого понимания того, как данные формируют реальность, и как эту реальность можно смоделировать с максимальной точностью и надежностью.
Оригинал статьи: https://arxiv.org/pdf/2603.07223.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- БИТКОИН ПРОГНОЗ. BTC криптовалюта
- ПРОГНОЗ ДОЛЛАРА К ШЕКЕЛЮ
- MYX ПРОГНОЗ. MYX криптовалюта
- ЭФИРИУМ ПРОГНОЗ. ETH криптовалюта
- SOL ПРОГНОЗ. SOL криптовалюта
- ПРОГНОЗ ДОЛЛАРА К ЗЛОТОМУ
- Золото прогноз
- ДОГЕКОИН ПРОГНОЗ. DOGE криптовалюта
- OM/USD
- SAROS ПРОГНОЗ. SAROS криптовалюта
2026-03-10 16:18