Предсказание курсов акций: объединяя данные и новости

Автор: Денис Аветисян

Новый подход к прогнозированию динамики фондового рынка сочетает в себе анализ новостного фона и современные методы обработки временных рядов.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

Предлагаемая система прогнозирования цен акций использует механизм внимания для обобщения новостных статей за каждый день, объединяет ежедневные исторические данные о ценах акций с соответствующей новостной информацией посредством слияния новостей и цен, а затем передает эти исторические представления в большую языковую модель для прогнозирования будущих цен, при этом процесс слияния может быть исключен из анализа.

В статье представлена методика, использующая механизмы внимания и языковые модели для повышения точности и обобщающей способности прогнозов котировок акций на нескольких рынках.

Прогнозирование цен акций традиционно сталкивается с трудностями в учете неструктурированной информации из новостных источников. В данной работе, озаглавленной ‘Generalized Stock Price Prediction for Multiple Stocks Combined with News Fusion’, предложен подход, интегрирующий большие языковые модели с ежедневными финансовыми новостями для повышения точности прогнозирования. Ключевым элементом является использование встраиваний названий акций в механизмах внимания для фильтрации релевантных новостей и последующего построения обобщенной модели, применимой к нескольким акциям. Эксперименты демонстрируют снижение средней абсолютной ошибки (MAE) на 7.11% по сравнению с базовыми моделями, что подтверждает эффективность предложенного подхода. Возможно ли дальнейшее повышение точности прогнозирования за счет интеграции более сложных моделей анализа новостного потока и расширения набора учитываемых факторов?

Трудности прогнозирования рыночной динамики

Традиционные методы прогнозирования временных рядов, такие как скользящие средние и экспоненциальное сглаживание, зачастую оказываются неэффективными при анализе фондового рынка. Их линейная природа плохо приспособлена к нелинейной динамике, присущей финансовым активам, где даже незначительные изменения в настроениях инвесторов или геополитической обстановке могут привести к существенным колебаниям цен. Сложность заключается в том, что рыночные паттерны редко бывают стабильными и предсказуемыми; они подвержены внезапным скачкам, долгосрочным трендам и сезонным колебаниям, которые трудно уловить с помощью простых статистических моделей. Попытки экстраполировать прошлые данные на будущее могут приводить к значительным ошибкам, особенно в периоды повышенной волатильности или фундаментальных изменений в экономике. В результате, несмотря на кажущуюся простоту, традиционные методы часто не способны выявить тонкие, но критически важные закономерности, определяющие движение цен на акции.

Растущий объем неструктурированных данных, в особенности новостных статей, представляет собой одновременно и перспективу, и сложность для точного прогнозирования цен на акции. Современные алгоритмы машинного обучения способны извлекать ценную информацию из текстовых источников, выявляя корреляции между новостными событиями и динамикой рынка. Однако, обработка таких данных требует преодоления ряда препятствий, включая неоднозначность языка, наличие «шума» в виде нерелевантной информации и необходимость учитывать контекст и эмоциональную окраску новостей. Успешное применение методов анализа текстовых данных позволяет не только предсказывать краткосрочные колебания цен, но и оценивать долгосрочные тренды, учитывая общее настроение инвесторов и влияние внешних факторов.

Сравнение среднеквадратичной абсолютной ошибки (MAE) 5-дневного прогноза цен с использованием различных базовых моделей (LLaMA и GPT-2) показывает, что применение SNP улучшает точность прогнозирования, при этом наиболее эффективными методами являются +CAP, +SAP и +PA-SAP по сравнению с базовым TimeLLM и +News.

Языковые модели в роли финансовых предсказателей

Крупные языковые модели, такие как BERT, LLaMA и GPT-2, предоставляют эффективные инструменты для кодирования и анализа семантической информации, содержащейся в новостных статьях. Эти модели, основанные на архитектуре трансформеров, способны улавливать сложные взаимосвязи между словами и фразами, выходя за рамки простого сопоставления ключевых слов. В процессе кодирования, текст преобразуется в многомерные векторные представления, сохраняющие смысловое значение. Это позволяет количественно оценить содержание новостей и использовать полученные данные для различных задач, включая анализ настроений, выявление тенденций и прогнозирование рыночных изменений. Эффективность этих моделей обусловлена их способностью к предварительному обучению на больших объемах текстовых данных, что позволяет им понимать нюансы языка и контекст информации.

Эффективное кодирование новостей является критически важным этапом в применении языковых моделей для финансового прогнозирования. Процесс заключается в преобразовании текстовой информации из новостных статей в числовые векторы, пригодные для количественного анализа. Данные модели, такие как BERT, LLaMA и GPT-2, используют различные методы, включая word embeddings и transformer-архитектуры, для представления семантического значения слов и фраз в виде многомерных векторов. Каждый вектор отражает контекст и взаимосвязи между словами, позволяя алгоритмам количественно оценивать тональность, значимость и потенциальное влияние новостного сообщения на финансовые рынки. Качество этого числового представления напрямую влияет на точность последующих прогнозов и анализ рыночных тенденций.

Интеграция языковых моделей в архитектуру Time-LLM позволяет анализировать временные ряды новостного текста и выявлять корреляции между семантическим содержанием новостей и динамикой финансовых рынков. Time-LLM использует выходные данные языковой модели — векторные представления новостных статей — в качестве входных признаков для моделей прогнозирования временных рядов, таких как ARIMA или LSTM. Этот подход позволяет учитывать не только количественные данные, но и качественную информацию, содержащуюся в новостях, что потенциально повышает точность прогнозов и предоставляет новые возможности для понимания рыночного поведения. Анализ влияния новостных событий на изменение волатильности, объемов торгов и цен активов становится возможным благодаря совместному использованию возможностей языковых моделей и алгоритмов анализа временных рядов.

Модуль объединения новостей и цен использует плотные слои для обработки эмбеддингов цен и новостей, затем применяет двунаправленное перекрестное внимание между ними и двухслойную GCN для моделирования их взаимодействия, объединяя полученные представления с исходными эмбеддингами через взвешенное среднее для получения финального результата.

Внимание к деталям: механизмы агрегации информации

Механизмы “Attentive Pooling”, включающие в себя “Self-Attentive Pooling”, “Cross-Attentive Pooling” и “Position-Aware Self-Attentive Pooling”, позволяют модели динамически оценивать важность различных частей новостных статей. В отличие от традиционных методов агрегации, которые применяют фиксированные веса или усреднение, attentive pooling вычисляет веса для каждого токена или сегмента текста на основе его релевантности для текущей задачи. Self-Attentive Pooling оценивает взаимосвязи внутри одной статьи, Cross-Attentive Pooling — между несколькими статьями, а Position-Aware Self-Attentive Pooling учитывает позицию токенов в тексте, что позволяет модели более эффективно извлекать значимую информацию и отфильтровывать шум.

Интеграция методов “News-Price Fusion” с “Graph Convolutional Networks” (GCN) позволяет модели более эффективно выявлять взаимосвязи между котировками акций и внешними событиями, отраженными в новостных потоках. “News-Price Fusion” объединяет данные о ценах активов с текстовой информацией из новостей, а GCN применяются для анализа графа связей между акциями и событиями. Это позволяет модели учитывать не только непосредственное влияние новостей на конкретную акцию, но и косвенные связи через другие активы и события, что улучшает точность прогнозирования и выявление скрытых зависимостей на финансовых рынках.

Применение методов агрегации информации, в частности Self-Attentive Pooling (+SAP), позволяет эффективно преобразовывать потоки новостных данных в сигналы, пригодные для прогнозирования. В ходе тестирования было установлено, что метод +SAP демонстрирует снижение средней абсолютной ошибки (MAE) на 7.11% по сравнению с базовыми моделями, что свидетельствует о его способности выделять наиболее релевантную информацию из новостного потока и повышать точность прогнозов.

Предложены три метода ежедневного объединения новостей, интегрирующих название акции: с использованием перекрестного внимания, где последовательность новостных вложений является ключом и значением, а вложение названия акции - запросом; путем добавления вложения названия акции в начало последовательности новостных вложений и применения самовнимания; и путем добавления вложения названия акции и позиционных вложений к последовательности новостных вложений посредством матричного сложения <span class="katex-eq" data-katex-display="false">\oplus</span> с последующим применением самовнимания. — Предложены три метода ежедневного объединения новостей, интегрирующих название акции: с использованием перекрестного внимания, где последовательность новостных вложений является ключом и значением, а вложение названия акции — запросом; путем добавления вложения названия акции в начало последовательности новостных вложений и применения самовнимания; и путем добавления вложения названия акции и позиционных вложений к последовательности новостных вложений посредством матричного сложения $\oplus$ с последующим применением самовнимания.

Подтверждение эффективности на реальных данных

Модель прошла всестороннюю проверку на двух ключевых наборах данных, представляющих рынки акций США и Тайваня — ‘BigData23’ и ‘TW21’ соответственно. Анализ показал высокую способность модели к точному прогнозированию, что подтверждается стабильными результатами на обоих рынках. Это указывает на обобщающую способность модели и её потенциал для применения в различных финансовых сценариях, не ограничиваясь только одним географическим регионом или спецификой рынка. Проверка на данных из разных источников обеспечивает уверенность в надежности и практической ценности разработанного подхода к прогнозированию.

Для оценки эффективности разработанной модели использовались общепринятые метрики, такие как средняя квадратичная ошибка $MSE$ и средняя абсолютная ошибка $MAE$ . Результаты показали устойчивое превосходство над базовыми моделями, что свидетельствует о высокой точности прогнозирования. В частности, применение метода самовнимательной агрегации (Self-Attentive Pooling) позволило добиться снижения средней абсолютной ошибки на 7.11% при анализе данных тайваньского фондового рынка (TW21 Dataset), подтверждая значительный вклад данной техники в повышение качества прогнозов.

В рамках подготовки данных для повышения точности прогнозирования использовалась процедура стандартизации, известная как ‘Standard Scaling’. Этот метод нормализации, заключающийся в приведении признаков к нулевому среднему и единичному стандартному отклонению, оказался критически важным для обеспечения стабильной сходимости модели и предотвращения проблем, связанных с разным масштабом входных данных. Стандартизация позволила оптимизировать процесс обучения, улучшить устойчивость модели к шумам и выбросам, а также ускорить вычисления, что в конечном итоге способствовало повышению общей производительности и надежности прогнозов на реальных данных фондовых рынков США и Тайваня.

Перспективы развития: повышение финансовой интеллектуальности

Дальнейшие исследования сосредоточены на применении методов “Prompt Engineering” для оптимизации взаимодействия языковой модели с задачей прогнозирования. Суть подхода заключается в тонкой настройке текстовых запросов, подаваемых модели, чтобы максимально раскрыть её потенциал в анализе финансовых данных и выявлении закономерностей. Оптимизация этих запросов, или “промптов”, позволяет не просто получать ответ, а направлять модель к более точным и релевантным прогнозам, учитывая нюансы рыночной динамики. Эксперименты направлены на выявление наиболее эффективных структур и формулировок промптов, способных значительно повысить качество прогнозов и, как следствие, улучшить инвестиционные решения.

Исследования направлены на усовершенствование архитектуры модели, в частности, на внедрение более сложных графовых структур и механизмов внимания. Такой подход позволит системе глубже анализировать взаимосвязи между различными финансовыми активами и факторами, выходя за рамки традиционных временных рядов. Использование графов позволит представить рынок как сеть, где каждый актив является узлом, а связи отражают корреляции и зависимости. Механизмы внимания, в свою очередь, позволят модели фокусироваться на наиболее значимых связях и факторах в каждый конкретный момент времени, игнорируя несущественные детали. В результате, прогнозирующая способность модели должна значительно возрасти, что позволит точнее оценивать риски и возможности на финансовых рынках и предоставлять инвесторам более обоснованные рекомендации.

Конечная цель исследований заключается в создании самообучающейся системы, способной адаптироваться к постоянно меняющимся рыночным условиям и предоставлять инвесторам практически применимые сведения. Такая система не просто анализирует исторические данные, но и непрерывно совершенствует свои алгоритмы прогнозирования, учитывая новые тенденции и факторы, влияющие на финансовые рынки. Предполагается, что подобный подход позволит значительно повысить точность прогнозов и, как следствие, предоставить инвесторам более обоснованные и эффективные стратегии принятия решений, способствуя оптимизации инвестиционных портфелей и повышению доходности.

Исследование демонстрирует, что попытки предсказать динамику фондового рынка — это не поиск универсальных закономерностей, а скорее, попытка объяснить случайные отклонения. Авторы предлагают сложный механизм интеграции новостного фона, полагаясь на внимание и языковые модели. Этот подход, безусловно, элегантен, однако напоминает попытку упорядочить хаос. Как говорил Фридрих Ницше: «Тот, кто сражается с чудовищами, должен позаботиться о том, чтобы самому не стать чудовищем». В данном случае, чрезмерное усложнение модели рискует привести к переобучению и потере способности к обобщению, что особенно актуально для нестабильных финансовых рынков. Подобные модели, в конечном итоге, отражают не истину, а лишь предрассудки тех, кто их создает.

Что дальше?

Представленная работа, безусловно, демонстрирует потенциал интеграции текстовой информации из новостных источников в модели прогнозирования динамики акций. Однако, устойчивость полученных результатов к непредсказуемым “черным лебедям” — событиям, радикально меняющим рыночную ситуацию — остается вопросом для дальнейшего изучения. Не стоит забывать, что корреляция не подразумевает причинно-следственной связи, и даже самые сложные модели могут оказаться бесполезными перед лицом истинно случайных колебаний.

Перспективным направлением представляется разработка методов оценки надежности новостных источников и фильтрации информационного шума. Попытки построить универсальную модель, способную эффективно работать на всех рынках, выглядят наивными; более реалистичным представляется создание адаптивных систем, способных учитывать специфику каждого конкретного рынка и оперативно перестраиваться в ответ на изменения внешней среды. Необходимо также учитывать возможность манипулирования информационным потоком и разрабатывать механизмы защиты от преднамеренно ложных или искаженных новостей.

В конечном итоге, успех в данной области зависит не столько от сложности используемых алгоритмов, сколько от способности исследователей сохранять критический взгляд на получаемые результаты и не поддаваться искушению построения слишком оптимистичных прогнозов. Рынок всегда найдет способ доказать, что даже самая элегантная модель — это лишь приближение к реальности, а не ее точное отражение.

Оригинал статьи: https://arxiv.org/pdf/2603.19286.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-23 10:45