Автор: Денис Аветисян
Исследователи представили систему VERAFI, объединяющую нейросимволический подход и агентов для повышения надежности и обоснованности финансовых решений.
Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.
Бесплатный Телеграм канал
VERAFI использует формальную верификацию и нейросимволический ИИ для создания проверенных политик финансового анализа и принятия решений.
Несмотря на успехи в области генеративных моделей, финансовые системы искусственного интеллекта остаются уязвимыми к расчетным ошибкам и нарушениям регуляторных требований. В данной работе представлена система VERAFI: Verified Agentic Financial Intelligence through Neurosymbolic Policy Generation, — агентский фреймворк, сочетающий извлечение информации, нейро-символическое построение политик и верифицированное финансовое рассуждение. Эксперименты на FinanceBench показали, что VERAFI достигает точности в 94.7%, значительно превосходя традиционные подходы (52.4%), и открывает путь к созданию надежных финансовых систем, соответствующих строгим требованиям регуляторов. Возможно ли, используя аналогичный подход, обеспечить формальную верификацию рассуждений в других критически важных областях применения ИИ?
Вызовы Финансовой Аналитики: Ручной Труд и Риски Ошибок
Традиционный финансовый анализ в значительной степени опирается на ручную проверку документов, что представляет собой трудоемкий и подверженный ошибкам процесс. Специалисты тратят значительное время на изучение больших объемов текстовой информации — от финансовых отчетов и контрактов до новостных статей и регуляторных документов — для выявления ключевых данных и оценки рисков. Эта ручная работа не только замедляет принятие решений, но и создает возможности для человеческих ошибок и упущений, что может привести к серьезным финансовым потерям. В условиях постоянно растущего объема финансовых данных и возрастающей сложности финансовых инструментов, зависимость от ручного анализа становится все более неэффективной и дорогостоящей, подчеркивая необходимость автоматизированных решений для повышения точности и скорости обработки информации.
Объемы и сложность финансовых данных неуклонно растут, создавая серьезные вызовы для традиционных методов анализа. Современные финансовые учреждения ежедневно сталкиваются с потоками информации из разнообразных источников — от отчетов компаний и новостных лент до социальных сетей и регуляторных документов. Ручная обработка таких объемов попросту невозможна, а ошибки в анализе чреваты значительными финансовыми потерями. В связи с этим, возникает острая потребность в автоматизированных решениях, способных не только быстро обрабатывать большие объемы данных, но и понимать их нюансы, выявлять скрытые закономерности и оценивать риски с высокой точностью. Эти системы должны обладать способностью к семантическому анализу, распознаванию сущностей и контекстуальному пониманию, чтобы эффективно извлекать ценную информацию из сложных финансовых текстов и обеспечивать принятие обоснованных решений.
Существующие методы обработки естественного языка (NLP) сталкиваются со значительными трудностями при анализе финансовых текстов, что обусловлено их высокой спецификой и строгими регуляторными требованиями. В отличие от общедоступных данных, финансовые документы изобилуют узкоспециализированной терминологией, сложными юридическими конструкциями и подразумевают абсолютную точность интерпретации. Стандартные алгоритмы NLP, обученные на общих корпусах текстов, зачастую не способны корректно распознавать и классифицировать эти нюансы, что приводит к ошибкам в извлечении информации и потенциальным нарушениям соответствия нормативным требованиям. Например, определение сущностей, таких как «деривативы» или «облигации с высоким доходом», требует глубокого понимания финансового контекста, а выявление обязательств по раскрытию информации или рисков требует учета сложных правовых положений. Неспособность NLP-систем учитывать эти факторы ограничивает их применимость в сфере финансового анализа и требует разработки специализированных моделей, учитывающих уникальные характеристики финансовых данных.

VERAFI: Нейросимволический Подход к Финансовым Рассуждениям
В основе системы VERAFI лежит двухэтапный процесс извлечения информации из финансовых документов. Первый этап обеспечивает широкий охват, осуществляя поиск по большому объему данных для выявления потенциально релевантных фрагментов. Второй этап фокусируется на повышении точности, отбирая из предварительно отобранных фрагментов наиболее соответствующие запросу и отсеивая нерелевантную информацию. Такой подход позволяет эффективно находить ключевые данные, сочетая полноту охвата с высокой степенью релевантности, что особенно важно при работе с большими объемами структурированных и неструктурированных финансовых текстов.
В VERAFI используется агентный фреймворк для решения сложных финансовых задач. Этот подход предполагает декомпозицию запроса на последовательность подзадач, каждая из которых решается с использованием специализированных инструментов. Фреймворк планирует последовательность действий, определяя, какие инструменты и в каком порядке необходимо применить для получения и обработки необходимой информации. Использование инструментов позволяет VERAFI выполнять сложные вычисления, извлекать данные из различных источников и осуществлять верификацию полученных результатов, что обеспечивает более точное и надежное решение финансовых вопросов.
Система VERAFI использует механизм генерации, управляемый нормативными требованиями и принципами бухгалтерского учета, для повышения достоверности получаемых результатов. В ходе тестирования VERAFI продемонстрировала 94,7% фактическую корректность ответов на финансовые вопросы, что на 81% превосходит показатели традиционных методов, основанных на плотном извлечении информации. Этот подход обеспечивает соответствие генерируемых выводов формальным финансовым стандартам и повышает надежность аналитических данных.

Технические Основы: Механизмы Извлечения и Рассуждений
Плотное извлечение фрагментов, основанное на моделях вроде Qwen3-Embedding-4B, обеспечивает эффективный начальный отбор документов. Этот процесс заключается в преобразовании как запроса пользователя, так и каждого документа в векторные представления высокой размерности. Сравнение этих векторов по мере близости позволяет быстро идентифицировать фрагменты, наиболее релевантные запросу, без необходимости точного совпадения ключевых слов. Модель Qwen3-Embedding-4B, благодаря своей архитектуре и обучению на большом объеме данных, обеспечивает высокую точность векторных представлений, что критически важно для эффективного поиска и снижения вычислительных затрат на начальном этапе обработки запроса.
Перекрестное кодирование (Cross-Encoder Reranking) с использованием модели Jina-reranker-v3 применяется для повышения точности поиска релевантных фрагментов текста после этапа извлечения плотных проходов. В отличие от методов, оценивающих релевантность независимо для каждого фрагмента, перекрестное кодирование обрабатывает запрос и каждый фрагмент текста совместно, учитывая их взаимодействие. Jina-reranker-v3 использует архитектуру Transformer для оценки релевантности пары «запрос-фрагмент», что позволяет выявлять более сложные связи и повышать точность ранжирования по сравнению с методами, основанными на векторном сходстве. Этот этап позволяет отфильтровать менее релевантные фрагменты, отобранные на первом этапе, и представить пользователю наиболее точные и полезные результаты.
Фреймворк Strands, расширяющий базовый Agentic Framework, обеспечивает динамическое планирование и выполнение аналитических задач. В его основе лежит возможность использования Python REPL для выполнения вычислений непосредственно в процессе анализа, что позволяет решать задачи, требующие численных расчетов или манипуляций с данными. Кроме того, Strands интегрирован с поиском в интернете (Web Search), что обеспечивает доступ к актуальной внешней информации и позволяет агенту дополнять свои знания для более точного и обоснованного анализа. Такая комбинация вычислительных возможностей и доступа к внешним данным позволяет Strands эффективно решать сложные аналитические задачи, требующие как внутренних вычислений, так и внешней информации.
Нейросимволическая автоматическая формализация преобразует политики, заданные на естественном языке, в спецификации формата SMT-lib. Этот процесс позволяет автоматизировать рассуждения и верификацию, представляя правила и ограничения в виде логических формул, пригодных для решателей SMT (Satisfiability Modulo Theories). Преобразование включает в себя извлечение ключевых понятий и отношений из текста политики и их кодирование в формальном языке $SMT-lib$, что обеспечивает возможность автоматической проверки корректности и полноты этих политик. Использование решателей SMT позволяет эффективно находить решения или доказывать, что решения не существуют, в соответствии с заданными ограничениями и правилами.
Валидация и Перспективы Развития
Тщательная оценка эффективности VERAFI проводилась с использованием признанных отраслевых бенчмарков, таких как FinanceBench, а также специализированных наборов данных для оценки качества ответов на вопросы в диалоговом режиме, например, ConvFinQA. Эти наборы данных позволили объективно оценить способность системы к точному извлечению финансовой информации и предоставлению релевантных ответов на сложные вопросы, имитирующие реальные запросы пользователей. Использование стандартных бенчмарков гарантирует сопоставимость результатов с другими системами анализа финансовых данных и подтверждает надежность и точность VERAFI в решении различных финансовых задач.
Для оценки достоверности и полноты генерируемых ответов в системе VERAFI используется инновационный подход, основанный на применении больших языковых моделей (LLM) в качестве автоматизированных экспертов. Вместо традиционной ручной проверки, LLM анализирует ответы, сопоставляя их с исходными данными и проверяя фактическую точность и охват ключевых аспектов финансовой информации. Такой метод позволяет не только значительно ускорить процесс оценки, но и обеспечить объективность и последовательность, исключая субъективные интерпретации. Использование LLM-as-a-Judge открывает возможности для автоматизированного контроля качества финансового анализа, что особенно важно при работе с большими объемами данных и сложными финансовыми моделями.
В основе системы VERAFI лежит формализация политик автоматизированного рассуждения, что обеспечивает принципиально новый уровень прозрачности и надежности в финансовом анализе. Вместо простого предоставления ответа, система явно определяет цепочку логических шагов и источников данных, на которых основано заключение. Такой подход позволяет не только проверить корректность полученных результатов, но и понять, каким образом система пришла к данному выводу, что критически важно для выявления потенциальных ошибок и обеспечения соответствия нормативным требованиям. Формализованные политики служат своего рода “аудиторским следом”, повышая доверие к системе и способствуя ее ответственному использованию в сфере финансов, где точность и обоснованность решений имеют первостепенное значение.
Дальнейшие исследования направлены на расширение области применения автоматизированных политик рассуждений, что позволит VERAFI анализировать более широкий спектр финансовых сценариев и данных. Планируется интеграция системы с потоками данных в реальном времени, что обеспечит актуальность и оперативность анализа. Предварительные результаты, демонстрирующие показатель Recall@3 в 66.7% при использовании метода Dense+Rerank, подтверждают высокую эффективность системы в извлечении релевантной информации, и указывают на значительный потенциал для дальнейшего улучшения точности и надежности финансовых прогнозов.
Исследование демонстрирует, что стремление к абсолютному соответствию одной модели реальности — иллюзия. VERAFI, представляя собой нейросимволическую систему, не претендует на истину в последней инстанции, а скорее предлагает механизм проверки и уточнения финансовых рассуждений. Это напоминает о словах Альбера Камю: «Бессмысленность жизни не означает, что она лишена смысла». Подобно тому, как Камю признавал абсурдность бытия, VERAFI признаёт неизбежность ошибок в финансовых моделях, но предлагает инструменты для их формальной верификации и минимизации. Система не ищет абсолютную уверенность, а стремится к последовательному уменьшению дисперсии, что соответствует принципам рационального анализа данных.
Что дальше?
Представленная работа, безусловно, демонстрирует потенциал нейросимволического подхода к финансовому анализу. Однако, не стоит обольщаться кажущейся точностью. Каждая метрика, даже подтвержденная формальной верификацией, — это, в сущности, идеология, замаскированная под числа. Если показатели растут, это, скорее всего, означает, что кто-то неправильно измеряет, а не то, что мир становится лучше. Основная проблема остается: как гарантировать, что формальные правила, лежащие в основе системы, адекватно отражают сложность и непредсказуемость реальных финансовых рынков?
Перспективы развития очевидны: необходимо сместить фокус с простого увеличения точности ответов на вопросы к созданию систем, способных к самокритике и выявлению собственных ошибок. Реализация «агентности» — это не просто автоматизация процесса поиска информации, а создание системы, осознающей границы своей компетенции и способной признать собственное незнание. Иначе мы получим лишь более изощренный инструмент для подтверждения заранее заданных убеждений.
Следующим шагом видится интеграция VERAFI с системами, способными к обучению на неполных и противоречивых данных. Поскольку абсолютной истины в финансах не существует, необходимо научить систему ориентироваться в серой зоне неопределенности и оценивать риски, а не только максимизировать прибыль. В конечном итоге, задача заключается не в создании идеального финансового оракула, а в построении системы, способной к разумному сомнению.
Оригинал статьи: https://arxiv.org/pdf/2512.14744.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- БИТКОИН ПРОГНОЗ. BTC криптовалюта
- ПРОГНОЗ ДОЛЛАРА К ШЕКЕЛЮ
- ЭФИРИУМ ПРОГНОЗ. ETH криптовалюта
- SOL ПРОГНОЗ. SOL криптовалюта
- SAROS ПРОГНОЗ. SAROS криптовалюта
- ZEC ПРОГНОЗ. ZEC криптовалюта
- STRK ПРОГНОЗ. STRK криптовалюта
- ПРОГНОЗ ЕВРО К ШЕКЕЛЮ
- ДОГЕКОИН ПРОГНОЗ. DOGE криптовалюта
- FARTCOIN ПРОГНОЗ. FARTCOIN криптовалюта
2025-12-18 08:04