Предсказание курсов акций: объединяя данные и новости

Автор: Денис Аветисян


Новый подход к прогнозированию динамики фондового рынка сочетает в себе анализ новостного фона и современные методы обработки временных рядов.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал
Предлагаемая система прогнозирования цен акций использует механизм внимания для обобщения новостных статей за каждый день, объединяет ежедневные исторические данные о ценах акций с соответствующей новостной информацией посредством слияния новостей и цен, а затем передает эти исторические представления в большую языковую модель для прогнозирования будущих цен, при этом процесс слияния может быть исключен из анализа.
Предлагаемая система прогнозирования цен акций использует механизм внимания для обобщения новостных статей за каждый день, объединяет ежедневные исторические данные о ценах акций с соответствующей новостной информацией посредством слияния новостей и цен, а затем передает эти исторические представления в большую языковую модель для прогнозирования будущих цен, при этом процесс слияния может быть исключен из анализа.

В статье представлена методика, использующая механизмы внимания и языковые модели для повышения точности и обобщающей способности прогнозов котировок акций на нескольких рынках.

Прогнозирование цен акций традиционно сталкивается с трудностями в учете неструктурированной информации из новостных источников. В данной работе, озаглавленной ‘Generalized Stock Price Prediction for Multiple Stocks Combined with News Fusion’, предложен подход, интегрирующий большие языковые модели с ежедневными финансовыми новостями для повышения точности прогнозирования. Ключевым элементом является использование встраиваний названий акций в механизмах внимания для фильтрации релевантных новостей и последующего построения обобщенной модели, применимой к нескольким акциям. Эксперименты демонстрируют снижение средней абсолютной ошибки (MAE) на 7.11% по сравнению с базовыми моделями, что подтверждает эффективность предложенного подхода. Возможно ли дальнейшее повышение точности прогнозирования за счет интеграции более сложных моделей анализа новостного потока и расширения набора учитываемых факторов?


Трудности прогнозирования рыночной динамики

Традиционные методы прогнозирования временных рядов, такие как скользящие средние и экспоненциальное сглаживание, зачастую оказываются неэффективными при анализе фондового рынка. Их линейная природа плохо приспособлена к нелинейной динамике, присущей финансовым активам, где даже незначительные изменения в настроениях инвесторов или геополитической обстановке могут привести к существенным колебаниям цен. Сложность заключается в том, что рыночные паттерны редко бывают стабильными и предсказуемыми; они подвержены внезапным скачкам, долгосрочным трендам и сезонным колебаниям, которые трудно уловить с помощью простых статистических моделей. Попытки экстраполировать прошлые данные на будущее могут приводить к значительным ошибкам, особенно в периоды повышенной волатильности или фундаментальных изменений в экономике. В результате, несмотря на кажущуюся простоту, традиционные методы часто не способны выявить тонкие, но критически важные закономерности, определяющие движение цен на акции.

Растущий объем неструктурированных данных, в особенности новостных статей, представляет собой одновременно и перспективу, и сложность для точного прогнозирования цен на акции. Современные алгоритмы машинного обучения способны извлекать ценную информацию из текстовых источников, выявляя корреляции между новостными событиями и динамикой рынка. Однако, обработка таких данных требует преодоления ряда препятствий, включая неоднозначность языка, наличие «шума» в виде нерелевантной информации и необходимость учитывать контекст и эмоциональную окраску новостей. Успешное применение методов анализа текстовых данных позволяет не только предсказывать краткосрочные колебания цен, но и оценивать долгосрочные тренды, учитывая общее настроение инвесторов и влияние внешних факторов.

Сравнение среднеквадратичной абсолютной ошибки (MAE) 5-дневного прогноза цен с использованием различных базовых моделей (LLaMA и GPT-2) показывает, что применение SNP улучшает точность прогнозирования, при этом наиболее эффективными методами являются +CAP, +SAP и +PA-SAP по сравнению с базовым TimeLLM и +News.
Сравнение среднеквадратичной абсолютной ошибки (MAE) 5-дневного прогноза цен с использованием различных базовых моделей (LLaMA и GPT-2) показывает, что применение SNP улучшает точность прогнозирования, при этом наиболее эффективными методами являются +CAP, +SAP и +PA-SAP по сравнению с базовым TimeLLM и +News.

Языковые модели в роли финансовых предсказателей

Крупные языковые модели, такие как BERT, LLaMA и GPT-2, предоставляют эффективные инструменты для кодирования и анализа семантической информации, содержащейся в новостных статьях. Эти модели, основанные на архитектуре трансформеров, способны улавливать сложные взаимосвязи между словами и фразами, выходя за рамки простого сопоставления ключевых слов. В процессе кодирования, текст преобразуется в многомерные векторные представления, сохраняющие смысловое значение. Это позволяет количественно оценить содержание новостей и использовать полученные данные для различных задач, включая анализ настроений, выявление тенденций и прогнозирование рыночных изменений. Эффективность этих моделей обусловлена их способностью к предварительному обучению на больших объемах текстовых данных, что позволяет им понимать нюансы языка и контекст информации.

Эффективное кодирование новостей является критически важным этапом в применении языковых моделей для финансового прогнозирования. Процесс заключается в преобразовании текстовой информации из новостных статей в числовые векторы, пригодные для количественного анализа. Данные модели, такие как BERT, LLaMA и GPT-2, используют различные методы, включая word embeddings и transformer-архитектуры, для представления семантического значения слов и фраз в виде многомерных векторов. Каждый вектор отражает контекст и взаимосвязи между словами, позволяя алгоритмам количественно оценивать тональность, значимость и потенциальное влияние новостного сообщения на финансовые рынки. Качество этого числового представления напрямую влияет на точность последующих прогнозов и анализ рыночных тенденций.

Интеграция языковых моделей в архитектуру Time-LLM позволяет анализировать временные ряды новостного текста и выявлять корреляции между семантическим содержанием новостей и динамикой финансовых рынков. Time-LLM использует выходные данные языковой модели — векторные представления новостных статей — в качестве входных признаков для моделей прогнозирования временных рядов, таких как ARIMA или LSTM. Этот подход позволяет учитывать не только количественные данные, но и качественную информацию, содержащуюся в новостях, что потенциально повышает точность прогнозов и предоставляет новые возможности для понимания рыночного поведения. Анализ влияния новостных событий на изменение волатильности, объемов торгов и цен активов становится возможным благодаря совместному использованию возможностей языковых моделей и алгоритмов анализа временных рядов.

Модуль объединения новостей и цен использует плотные слои для обработки эмбеддингов цен и новостей, затем применяет двунаправленное перекрестное внимание между ними и двухслойную GCN для моделирования их взаимодействия, объединяя полученные представления с исходными эмбеддингами через взвешенное среднее для получения финального результата.
Модуль объединения новостей и цен использует плотные слои для обработки эмбеддингов цен и новостей, затем применяет двунаправленное перекрестное внимание между ними и двухслойную GCN для моделирования их взаимодействия, объединяя полученные представления с исходными эмбеддингами через взвешенное среднее для получения финального результата.

Внимание к деталям: механизмы агрегации информации

Механизмы “Attentive Pooling”, включающие в себя “Self-Attentive Pooling”, “Cross-Attentive Pooling” и “Position-Aware Self-Attentive Pooling”, позволяют модели динамически оценивать важность различных частей новостных статей. В отличие от традиционных методов агрегации, которые применяют фиксированные веса или усреднение, attentive pooling вычисляет веса для каждого токена или сегмента текста на основе его релевантности для текущей задачи. Self-Attentive Pooling оценивает взаимосвязи внутри одной статьи, Cross-Attentive Pooling — между несколькими статьями, а Position-Aware Self-Attentive Pooling учитывает позицию токенов в тексте, что позволяет модели более эффективно извлекать значимую информацию и отфильтровывать шум.

Интеграция методов “News-Price Fusion” с “Graph Convolutional Networks” (GCN) позволяет модели более эффективно выявлять взаимосвязи между котировками акций и внешними событиями, отраженными в новостных потоках. “News-Price Fusion” объединяет данные о ценах активов с текстовой информацией из новостей, а GCN применяются для анализа графа связей между акциями и событиями. Это позволяет модели учитывать не только непосредственное влияние новостей на конкретную акцию, но и косвенные связи через другие активы и события, что улучшает точность прогнозирования и выявление скрытых зависимостей на финансовых рынках.

Применение методов агрегации информации, в частности Self-Attentive Pooling (+SAP), позволяет эффективно преобразовывать потоки новостных данных в сигналы, пригодные для прогнозирования. В ходе тестирования было установлено, что метод +SAP демонстрирует снижение средней абсолютной ошибки (MAE) на 7.11% по сравнению с базовыми моделями, что свидетельствует о его способности выделять наиболее релевантную информацию из новостного потока и повышать точность прогнозов.

Предложены три метода ежедневного объединения новостей, интегрирующих название акции: с использованием перекрестного внимания, где последовательность новостных вложений является ключом и значением, а вложение названия акции - запросом; путем добавления вложения названия акции в начало последовательности новостных вложений и применения самовнимания; и путем добавления вложения названия акции и позиционных вложений к последовательности новостных вложений посредством матричного сложения <span class="katex-eq" data-katex-display="false">\oplus</span> с последующим применением самовнимания.
Предложены три метода ежедневного объединения новостей, интегрирующих название акции: с использованием перекрестного внимания, где последовательность новостных вложений является ключом и значением, а вложение названия акции — запросом; путем добавления вложения названия акции в начало последовательности новостных вложений и применения самовнимания; и путем добавления вложения названия акции и позиционных вложений к последовательности новостных вложений посредством матричного сложения \oplus с последующим применением самовнимания.

Подтверждение эффективности на реальных данных

Модель прошла всестороннюю проверку на двух ключевых наборах данных, представляющих рынки акций США и Тайваня — ‘BigData23’ и ‘TW21’ соответственно. Анализ показал высокую способность модели к точному прогнозированию, что подтверждается стабильными результатами на обоих рынках. Это указывает на обобщающую способность модели и её потенциал для применения в различных финансовых сценариях, не ограничиваясь только одним географическим регионом или спецификой рынка. Проверка на данных из разных источников обеспечивает уверенность в надежности и практической ценности разработанного подхода к прогнозированию.

Для оценки эффективности разработанной модели использовались общепринятые метрики, такие как средняя квадратичная ошибка MSE и средняя абсолютная ошибка MAE. Результаты показали устойчивое превосходство над базовыми моделями, что свидетельствует о высокой точности прогнозирования. В частности, применение метода самовнимательной агрегации (Self-Attentive Pooling) позволило добиться снижения средней абсолютной ошибки на 7.11% при анализе данных тайваньского фондового рынка (TW21 Dataset), подтверждая значительный вклад данной техники в повышение качества прогнозов.

В рамках подготовки данных для повышения точности прогнозирования использовалась процедура стандартизации, известная как ‘Standard Scaling’. Этот метод нормализации, заключающийся в приведении признаков к нулевому среднему и единичному стандартному отклонению, оказался критически важным для обеспечения стабильной сходимости модели и предотвращения проблем, связанных с разным масштабом входных данных. Стандартизация позволила оптимизировать процесс обучения, улучшить устойчивость модели к шумам и выбросам, а также ускорить вычисления, что в конечном итоге способствовало повышению общей производительности и надежности прогнозов на реальных данных фондовых рынков США и Тайваня.

Перспективы развития: повышение финансовой интеллектуальности

Дальнейшие исследования сосредоточены на применении методов “Prompt Engineering” для оптимизации взаимодействия языковой модели с задачей прогнозирования. Суть подхода заключается в тонкой настройке текстовых запросов, подаваемых модели, чтобы максимально раскрыть её потенциал в анализе финансовых данных и выявлении закономерностей. Оптимизация этих запросов, или “промптов”, позволяет не просто получать ответ, а направлять модель к более точным и релевантным прогнозам, учитывая нюансы рыночной динамики. Эксперименты направлены на выявление наиболее эффективных структур и формулировок промптов, способных значительно повысить качество прогнозов и, как следствие, улучшить инвестиционные решения.

Исследования направлены на усовершенствование архитектуры модели, в частности, на внедрение более сложных графовых структур и механизмов внимания. Такой подход позволит системе глубже анализировать взаимосвязи между различными финансовыми активами и факторами, выходя за рамки традиционных временных рядов. Использование графов позволит представить рынок как сеть, где каждый актив является узлом, а связи отражают корреляции и зависимости. Механизмы внимания, в свою очередь, позволят модели фокусироваться на наиболее значимых связях и факторах в каждый конкретный момент времени, игнорируя несущественные детали. В результате, прогнозирующая способность модели должна значительно возрасти, что позволит точнее оценивать риски и возможности на финансовых рынках и предоставлять инвесторам более обоснованные рекомендации.

Конечная цель исследований заключается в создании самообучающейся системы, способной адаптироваться к постоянно меняющимся рыночным условиям и предоставлять инвесторам практически применимые сведения. Такая система не просто анализирует исторические данные, но и непрерывно совершенствует свои алгоритмы прогнозирования, учитывая новые тенденции и факторы, влияющие на финансовые рынки. Предполагается, что подобный подход позволит значительно повысить точность прогнозов и, как следствие, предоставить инвесторам более обоснованные и эффективные стратегии принятия решений, способствуя оптимизации инвестиционных портфелей и повышению доходности.

Исследование демонстрирует, что попытки предсказать динамику фондового рынка — это не поиск универсальных закономерностей, а скорее, попытка объяснить случайные отклонения. Авторы предлагают сложный механизм интеграции новостного фона, полагаясь на внимание и языковые модели. Этот подход, безусловно, элегантен, однако напоминает попытку упорядочить хаос. Как говорил Фридрих Ницше: «Тот, кто сражается с чудовищами, должен позаботиться о том, чтобы самому не стать чудовищем». В данном случае, чрезмерное усложнение модели рискует привести к переобучению и потере способности к обобщению, что особенно актуально для нестабильных финансовых рынков. Подобные модели, в конечном итоге, отражают не истину, а лишь предрассудки тех, кто их создает.

Что дальше?

Представленная работа, безусловно, демонстрирует потенциал интеграции текстовой информации из новостных источников в модели прогнозирования динамики акций. Однако, устойчивость полученных результатов к непредсказуемым “черным лебедям” — событиям, радикально меняющим рыночную ситуацию — остается вопросом для дальнейшего изучения. Не стоит забывать, что корреляция не подразумевает причинно-следственной связи, и даже самые сложные модели могут оказаться бесполезными перед лицом истинно случайных колебаний.

Перспективным направлением представляется разработка методов оценки надежности новостных источников и фильтрации информационного шума. Попытки построить универсальную модель, способную эффективно работать на всех рынках, выглядят наивными; более реалистичным представляется создание адаптивных систем, способных учитывать специфику каждого конкретного рынка и оперативно перестраиваться в ответ на изменения внешней среды. Необходимо также учитывать возможность манипулирования информационным потоком и разрабатывать механизмы защиты от преднамеренно ложных или искаженных новостей.

В конечном итоге, успех в данной области зависит не столько от сложности используемых алгоритмов, сколько от способности исследователей сохранять критический взгляд на получаемые результаты и не поддаваться искушению построения слишком оптимистичных прогнозов. Рынок всегда найдет способ доказать, что даже самая элегантная модель — это лишь приближение к реальности, а не ее точное отражение.


Оригинал статьи: https://arxiv.org/pdf/2603.19286.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-23 10:45