Финансовые отчеты под вопросом: как улучшить ответы с помощью искусственного интеллекта

Автор: Денис Аветисян

Новая система, использующая переранжировку с помощью нейронных сетей, значительно повышает точность ответов на вопросы по финансовым отчетам.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

В ходе исследования обработки запросов оценивалось влияние этапа переранжирования на общую производительность конвейера, включающего перефразировку, гибридный поиск (FTS + семантический), слияние RRF и генерацию ответов, что позволило выявить его вклад в оптимизацию результатов.

Исследование демонстрирует, что нейронная переранжировка улучшает производительность систем Retrieval-Augmented Generation (RAG) при анализе отчетов 10-K на 15,5 процентных пункта.

Анализ обширных финансовых отчетов, таких как 10-K, представляет собой сложную задачу из-за их объема и сложности. В статье ‘Enhancing Financial Report Question-Answering: A Retrieval-Augmented Generation System with Reranking Analysis’ предложена система на основе извлечения и генерации (RAG), предназначенная для ответа на вопросы по финансовым отчетам компаний из индекса S&P 500. Результаты исследований показали, что применение нейронной переранжировки значительно повышает качество ответов, увеличивая точность на 15,5 процентных пункта. Каким образом дальнейшая оптимизация стратегий поиска и переранжировки может еще больше улучшить эффективность систем RAG в области финансового анализа и раскрытия информации?

Сложность анализа финансовой информации

Анализ обширных и сложных финансовых документов, таких как годовые отчеты формы 10-K, представляет собой серьезную проблему для современных систем обработки информации. Эти документы отличаются не только значительным объемом, часто насчитывающим сотни страниц, но и использованием специфической терминологии, юридических формулировок и сложной структуры. Понимание нюансов, скрытых в этих текстах, требует не просто распознавания ключевых слов, но и глубокого анализа контекста, что затрудняет автоматизацию процесса извлечения полезных сведений. В результате, даже самые продвинутые алгоритмы часто сталкиваются с трудностями при идентификации важных тенденций, рисков и возможностей, содержащихся в этих документах, что подчеркивает необходимость разработки новых, более эффективных методов обработки финансовой информации.

Традиционные методы поиска, основанные на ключевых словах, зачастую оказываются неэффективными при анализе финансовой документации. Они не способны уловить тонкие смысловые оттенки и контекст, необходимые для получения точных ответов на сложные вопросы. Проблема заключается в том, что финансовые тексты изобилуют специфической терминологией, синонимами и косвенными выражениями, которые не всегда корректно интерпретируются простым сопоставлением ключевых слов. В результате, система может выдать множество нерелевантных результатов или пропустить важную информацию, скрытую за лингвистической сложностью. Таким образом, для эффективного анализа финансовых данных требуется применение более продвинутых методов, учитывающих семантическое значение слов и их взаимосвязь в контексте.

Повышающийся спрос на автоматизированный финансовый анализ обуславливает необходимость в создании надежных систем ответов на вопросы, способных к логическому выводу на основе огромных объемов данных. Современные финансовые рынки генерируют колоссальное количество информации, представленной в различных форматах — от отчетов компаний до новостных лент и аналитических обзоров. Для эффективной обработки и извлечения ценной информации из этих массивов данных требуется не просто поиск по ключевым словам, а именно способность системы понимать контекст, выявлять взаимосвязи и делать обоснованные выводы. Такие системы должны уметь отвечать на сложные вопросы, требующие анализа нескольких источников информации и проведения логических рассуждений, что представляет собой серьезную задачу для современных алгоритмов искусственного интеллекта и требует разработки новых методов машинного обучения и обработки естественного языка.

Система обработки документов преобразует HTML-отчеты в PDF, извлекает и разделяет текст на фрагменты, генерирует векторные представления и сохраняет данные в SQLite для ключевого поиска и FAISS для семантического поиска.

RAG: Система интеллектуального поиска

Наша система RAG (Retrieval-Augmented Generation) объединяет преимущества поиска информации и генерации текста. Она использует предварительно обученные языковые модели для синтеза ответов на запросы пользователей, опираясь на релевантные документы, полученные в результате поиска. Вместо прямого использования знаний, заложенных в модель, система сначала извлекает информацию из внешних источников, а затем использует эту информацию для формирования ответа. Этот подход позволяет модели предоставлять более точные, контекстуально релевантные и обоснованные ответы, особенно в случаях, когда требуются знания, не включенные в исходный набор данных модели.

Гибридный поиск является ключевым компонентом системы, объединяя преимущества полнотекстового поиска и семантического поиска по сходству. Полнотекстовый поиск идентифицирует документы, содержащие точные ключевые слова из запроса, обеспечивая высокую точность совпадений. Семантический поиск, основанный на векторном представлении текста и вычислении косинусного сходства, позволяет находить документы, релевантные по смыслу, даже если они не содержат точных совпадений ключевых слов. Комбинирование этих двух подходов позволяет значительно повысить полноту и точность извлечения информации, обеспечивая более релевантные результаты для пользователя.

Для повышения точности и релевантности ответов в нашей системе RAG используется модель GPT-4.1 для перефразирования запросов пользователей. Данный процесс включает в себя анализ исходного вопроса с целью выявления скрытого смысла и переформулировку его в более четкий и однозначный запрос, оптимизированный для поиска информации. Перефразирование позволяет учесть синонимы, контекст и возможные неточности в формулировке исходного вопроса, что значительно улучшает качество извлечения релевантных документов из базы знаний и, как следствие, повышает точность генерируемых ответов. Использование GPT-4.1 обеспечивает эффективную обработку сложных и неоднозначных запросов, гарантируя, что система правильно интерпретирует намерения пользователя.

Под капотом: Эффективные технологии поиска

Для полнотекстового поиска используется FTS5 — мощное расширение для SQLite, обеспечивающее быстрый поиск по ключевым словам внутри документов. FTS5 оптимизирован для работы с большими объемами текстовых данных, индексируя содержимое документов и позволяя осуществлять поиск с высокой скоростью. В отличие от простых поисков по строкам, FTS5 поддерживает различные операторы и функции, такие как стемминг, удаление стоп-слов и нечеткий поиск, что повышает точность и релевантность результатов. Использование FTS5 позволяет эффективно находить документы, содержащие заданные ключевые слова, даже если они встречаются в разных формах или контекстах.

Поиск семантической близости осуществляется с использованием библиотеки FAISS, разработанной для эффективного поиска и кластеризации плотных векторов. Эти векторы генерируются посредством Text Embeddings — процесса преобразования текстовых данных в числовые представления, отражающие их семантическое значение. FAISS оптимизирован для работы с многомерными векторами и обеспечивает высокую скорость поиска ближайших соседей, что критически важно при работе с большими объемами текстовых данных и позволяет находить документы, близкие по смыслу, даже если они не содержат одинаковых ключевых слов. Алгоритмы FAISS включают в себя различные методы индексации и квантования, направленные на снижение вычислительной сложности и потребления памяти при сохранении высокой точности поиска.

Использование технологий полнотекстового поиска и семантического поиска критически важно для оперативного извлечения релевантных фрагментов из обширного массива финансовых отчетов. Объем и сложность данных, содержащихся в этих отчетах, требуют высокой производительности при поиске, чтобы аналитики и другие пользователи могли быстро находить необходимую информацию. Без эффективных инструментов поиска обработка и анализ больших объемов финансовой отчетности значительно замедляется, что негативно сказывается на скорости принятия решений и качестве финансового анализа.

Уточнение результатов с помощью нейронного переранжирования

Для повышения релевантности результатов поиска мы реализовали нейронное переранжирование, используя кросс-энкодерные модели, в частности Jina Reranker v2. Этот процесс предполагает повторную оценку извлеченных кандидатов на основе степени их соответствия поисковому запросу. Кросс-энкодеры анализируют запрос и документ совместно, что позволяет более точно определить релевантность по сравнению с традиционными методами, оценивающими запрос и документ независимо. Jina Reranker v2, выбранный для данной реализации, предоставляет оптимизированную архитектуру и алгоритмы для эффективного переранжирования больших объемов данных.

Применение нейронного переранжирования значительно повышает точность результатов поиска за счет приоритизации наиболее релевантных фрагментов текста. В отличие от традиционных методов, которые оценивают релевантность на основе отдельных признаков, нейные модели учитывают семантическое взаимодействие между запросом и документом, что позволяет более точно определить степень соответствия. Это приводит к тому, что в верхних позициях результатов поиска оказываются именно те фрагменты, которые наиболее полно и точно отвечают на запрос пользователя, снижая количество нерелевантной информации.

Результаты тестирования показали, что применение нейронного переранжирования повышает точность результатов поиска на 15,5 процентных пункта. При использовании набора данных FinDER, точность достигла 49,0% после применения переранжирования, в то время как без него данный показатель составлял 33,5%. Данное улучшение демонстрирует значительное повышение релевантности выдаваемых документов по отношению к поисковому запросу.

Оценка точности и производительности системы

Для оценки достоверности сгенерированных ответов была разработана комплексная метрика — «Коэффициент достоверности», основанная на данных из набора FinDER. Данный показатель позволяет объективно измерить, насколько точно и полно ответы соответствуют исходным запросам. В процессе анализа учитывается не только фактическая правильность информации, но и ее релевантность контексту вопроса. Использование набора данных FinDER гарантирует, что оценка достоверности проводится на основе разнообразного и репрезентативного набора вопросов и ответов, что повышает надежность полученных результатов и позволяет более точно сравнивать эффективность различных систем.

Для обеспечения объективной оценки качества и релевантности генерируемых ответов, в рамках исследования была применена методика, использующая большую языковую модель (LLM) в качестве эксперта-оценщика. Данный подход позволил автоматизировать процесс анализа, избежав субъективности, присущей ручной оценке. LLM, обученная на обширном корпусе текстов, способна оценивать ответы по различным критериям, включая логическую связность, соответствие фактам и общую информативность. В процессе оценки модель присваивает каждому ответу балл, отражающий степень его корректности и полезности, что позволяет количественно измерить эффективность разработанной системы и сравнить её с другими подходами.

Система продемонстрировала значительное повышение точности ответов, достигнув показателя в 49,0%, что на 15,5 процентных пункта выше, чем у систем без повторной ранжировки. Наблюдалось существенное снижение доли полностью неверных ответов (оценка 1) — с 35,3% до 22,5%, что составляет уменьшение на 12,8 процентных пункта. Средняя оценка ответов составила 6,02, увеличившись на 1,07 пункта, что свидетельствует о более высоком качестве генерируемого контента. Кроме того, доля полностью корректных ответов (оценка 10) возросла на 3,6 процентных пункта, достигнув 13,8%, что подтверждает эффективность предложенного подхода к повышению надежности и точности системы.

Исследование демонстрирует, что внедрение нейронного переранжирования в системы RAG значительно повышает точность ответов на вопросы, связанные с финансовой отчётностью. Этот подход, позволяющий отфильтровать нерелевантную информацию из 10-K отчётов, не просто улучшает производительность, но и подчеркивает неизбежный компромисс между теоретической элегантностью и практической необходимостью. Как однажды заметил Линус Торвальдс: «Плохой код — это просто сложный код, который ещё не был отлажен». В данном контексте, кажущаяся сложность финансовой отчётности требует именно такого подхода — постоянной оптимизации и переработки информации для достижения конкретного результата, а не следования абстрактным идеалам.

Что дальше?

Представленные улучшения в системах поиска и генерации ответов на вопросы по финансовой отчётности, безусловно, приятны. Пятнадцать с лишним процентов точности — это, конечно, хорошо, пока не наткнёшься на первый реальный производственный кейс. Продакшен всегда найдет способ сломать даже самую элегантную архитектуру. Впрочем, это и к лучшему — рано или поздно, система начнет выдавать осмысленные галлюцинации, что позволит понять, где ещё нужно копать.

Вопрос не в том, чтобы достичь идеальной точности, а в том, чтобы понять, где эта точность перестаёт иметь значение. Сколько ошибок допустимо, прежде чем генерация ответа станет просто шумом? И как оценить стоимость этих ошибок? В конечном итоге, всё новое — это старое, только с другим именем и теми же багами. Перефразируя классика, «всё течёт, всё изменяется… и всё равно где-то проскакивает ошибка округления».

Похоже, ближайшее будущее — это не совершенствование алгоритмов, а разработка инструментов для выявления и смягчения последствий их неизбежных ошибок. И, возможно, принятие того факта, что идеального финансового советника, основанного на искусственном интеллекте, просто не существует. Остается надеяться, что он хотя бы не будет рекомендовать покупать акции обанкротившейся компании.

Оригинал статьи: https://arxiv.org/pdf/2603.16877.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-19 17:39