Смогут ли нейросети «прочитать» графики акций?

Автор: Денис Аветисян

Новое исследование оценивает способность современных моделей, объединяющих зрение и язык, понимать многомасштабные графики «японских свечей» для прогнозирования цен на акции.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

Ежедневная свечная диаграмма демонстрирует динамику изменения цены актива, отражая соотношение между ценой открытия и закрытия, а также максимальные и минимальные значения за определенный период, что позволяет оценить волатильность и потенциальные тренды.

Представлен новый набор данных и методика оценки, выявляющие сильные стороны моделей в краткосрочном прогнозировании и их подверженность различным смещениям.

Несмотря на растущий интерес к применению моделей «зрение-язык» (VLM) для прогнозирования цен акций, их реальная способность к интерпретации графиков «японских свечей» остаётся недостаточно изученной. В работе ‘Do VLMs Truly «Read» Candlesticks? A Multi-Scale Benchmark for Visual Stock Price Forecasting’ предложен новый многомасштабный набор данных и методика оценки, позволяющая проверить, насколько эффективно VLM используют визуальные сигналы для прогнозирования динамики рынка. Результаты показали, что большинство моделей демонстрируют хорошие результаты лишь при устойчивых трендах, выявляя предвзятости и ограниченную чувствительность к горизонту прогнозирования. Возможно ли создание VLM, способных к более глубокому анализу «японских свечей» и эффективному прогнозированию в условиях сложной рыночной конъюнктуры?

Преходящая Природа Традиционного Анализа

Традиционный технический анализ, опирающийся на изучение исторических данных, всё чаще сталкивается с ограничениями в условиях современной динамичной торговли. Сложность современных финансовых рынков, обусловленная высокой скоростью транзакций, глобальной взаимосвязанностью и влиянием непредсказуемых событий, затрудняет выявление надёжных закономерностей. Кроме того, значительная часть технического анализа предполагает ручное распознавание графических паттернов, что делает процесс субъективным и подверженным человеческим ошибкам. Несмотря на кажущуюся простоту, интерпретация графиков требует значительного опыта и может приводить к различным выводам у разных аналитиков, снижая практическую ценность этого подхода в условиях высокой конкуренции и волатильности.

Существующие методы прогнозирования цен акций, такие как ARIMA, зачастую оказываются неэффективными из-за неспособности адекватно учитывать нелинейную динамику рынков. Традиционные модели, основанные на предположении о линейной зависимости между прошлыми и будущими значениями, игнорируют сложные взаимосвязи и внезапные изменения, характерные для финансовых рынков. Это приводит к систематическим ошибкам в прогнозах, особенно в периоды высокой волатильности или при формировании новых трендов. Неспособность уловить эти нелинейные зависимости ограничивает точность прогнозирования и снижает эффективность инвестиционных стратегий, требуя разработки более сложных и адаптивных моделей, способных учитывать присущую рынку непредсказуемость.

Визуализация рыночных данных посредством японских свечных графиков представляет собой мощный инструмент, однако извлечение значимых выводов из них требует существенного опыта и знаний. Несмотря на кажущуюся простоту, интерпретация паттернов, формирующихся на свечных графиках, часто носит субъективный характер и зависит от индивидуального восприятия аналитика. Различные трейдеры могут видеть разные сигналы в одном и том же графике, что приводит к расхождению в торговых стратегиях и, как следствие, к неоднозначным результатам. Для минимизации субъективности и повышения точности анализа требуется глубокое понимание принципов построения свечных паттернов, умение учитывать контекст рынка и использование дополнительных инструментов технического анализа.

Тепловая карта показывает, что бычий рынок характеризуется преобладанием положительных изменений, в то время как медвежий рынок демонстрирует преобладание отрицательных изменений.

Машинное Обучение: Новый Инструмент Прогнозирования

Алгоритмы машинного обучения, такие как XGBoost и LightGBM, демонстрируют превосходную эффективность в прогнозировании цен акций благодаря способности выявлять сложные зависимости в числовых временных рядах. Эти алгоритмы, в отличие от традиционных статистических методов, способны учитывать нелинейные взаимосвязи и взаимодействия между различными факторами, влияющими на цену акции. Они используют ансамблевые методы, объединяя прогнозы множества слабых моделей для создания более точного и устойчивого прогноза. Эффективность XGBoost и LightGBM обусловлена использованием градиентного бустинга, что позволяет последовательно улучшать точность модели путем фокусировки на ошибках предыдущих итераций. В результате, эти алгоритмы часто превосходят другие методы прогнозирования в задачах, требующих анализа и экстраполяции сложных временных рядов.

Глубокие нейронные сети, в частности, сверточные нейронные сети (CNN), способны автоматически извлекать релевантные признаки непосредственно из графиков «японских свечей» (candlestick charts). В отличие от традиционных методов прогнозирования, требующих ручной разработки и отбора признаков, CNN анализируют визуальные паттерны на графиках, идентифицируя закономерности, коррелирующие с изменениями цен. Этот подход позволяет значительно сократить трудозатраты на предобработку данных и повысить эффективность модели, поскольку CNN самостоятельно адаптируется к особенностям временных рядов, представленных в виде графиков, и выявляет важные для прогнозирования характеристики.

Интеграция моделей «зрение-язык» представляет собой новый подход к анализу финансовых данных, объединяя визуальную информацию с графиков с текстовыми данными, такими как новости и отчеты. Данный подход позволяет получить более полное представление о динамике рынка, поскольку учитываются как количественные показатели, отраженные на графиках, так и качественная информация из текстовых источников. По результатам тестирования, точность моделей, использующих данную интеграцию, составляет от 50.9% до 52.6% в нормальных рыночных условиях, что демонстрирует потенциал данного метода для повышения эффективности прогнозирования.

На графике представлена типичная недельная свеча, демонстрирующая ценовые колебания за период в одну неделю.

Валидация Моделей и Рыночный Контекст

Для оценки точности и надежности моделей прогнозирования цен акций ключевыми метриками являются матрица ошибок (Confusion Matrix) и информационный коэффициент (Information Coefficient). Матрица ошибок позволяет визуализировать результаты классификации, показывая количество верно и неверно предсказанных случаев для каждого класса (например, рост или падение цены). Информационный коэффициент, измеряющий корреляцию между предсказанными и фактическими изменениями цен, позволяет оценить способность модели различать направление движения цены. Более высокие значения информационного коэффициента указывают на лучшую прогностическую силу модели, однако необходимо учитывать, что интерпретация этого показателя требует анализа в контексте конкретной торговой стратегии и рыночных условий.

Оценка производительности моделей прогнозирования цен акций на различных рыночных индексах, таких как S&P 500 и HS300, является критически важной для подтверждения их обобщающей способности и устойчивости. Анализ результатов на нескольких индексах позволяет выявить потенциальные систематические ошибки, связанные со спецификой отдельного рынка. Модель, демонстрирующая стабильную производительность на различных индексах, с большей вероятностью будет успешно работать в реальных торговых условиях и адаптироваться к изменяющимся рыночным условиям, в отличие от модели, оптимизированной только для одного конкретного индекса.

Применение многомасштабного анализа, основанного на принципах теории Доу и теории волн Эллиотта, позволяет выявлять скрытые закономерности и повышать предсказательную силу моделей прогнозирования цен акций. В ходе тестирования модели Claude-Sonnet-4-5 продемонстрировали коэффициент информации (Information Coefficient) в 0.047, с коэффициентом информационного дохода (ICIR) равным 0.236 для 5-дневных прогнозов и 0.042 с ICIR 0.258 для 30-дневных прогнозов. Данные показатели свидетельствуют о способности модели генерировать сигналы, которые могут быть использованы для формирования инвестиционных стратегий.

Представленный график демонстрирует смещение каждой модели, отражая её склонность к определённым результатам.

Влияние на Будущие Инвестиционные Стратегии

Способность точно предсказывать будущую доходность предоставляет инвесторам ключевое преимущество в принятии обоснованных решений. Это позволяет не только оптимизировать распределение активов в портфеле для достижения максимальной прибыли, но и эффективно снижать риски, предвидя потенциальные убытки. Тщательный анализ данных и использование передовых методов прогнозирования дают возможность выявлять наиболее перспективные активы и избегать инвестиций в те, которые могут оказаться убыточными. В конечном итоге, точное предсказание будущей доходности способствует более устойчивому и прибыльному инвестиционному процессу, позволяя инвесторам достигать своих финансовых целей с большей уверенностью.

Автоматизированный анализ рыночных данных позволяет значительно снизить зависимость от субъективных оценок и ускорить процесс принятия инвестиционных решений. Традиционно, интерпретация финансовых показателей требовала значительных усилий экспертов, чьи взгляды могли быть подвержены личным предубеждениям или неполной информации. Однако, современные алгоритмы способны обрабатывать огромные объемы данных, выявляя закономерности и тренды, которые остаются незамеченными при ручном анализе. Это не только повышает объективность оценки, но и позволяет оперативно реагировать на изменения рыночной конъюнктуры, что особенно важно в условиях высокой волатильности. Благодаря автоматизации, инвесторы получают возможность принимать более взвешенные и обоснованные решения, основанные на фактических данных, а не на интуиции или догадках.

Интеграция методов машинного обучения с классическим техническим анализом существенно повышает эффективность инвестиционных стратегий и открывает новые возможности для инвесторов. Разработанные модели демонстрируют повышенную точность в периоды спада рынка, что позволяет более эффективно выявлять и оценивать риски снижения стоимости активов. При этом, алгоритм $XGBoost$ показывает сравнительно более низкую эффективность — всего 43.8% — при анализе растущих рынков, что указывает на потенциальные области для дальнейшей оптимизации и адаптации моделей к различным рыночным условиям. Такое сочетание традиционных и передовых методов позволяет не только улучшить прогнозирование, но и создать более устойчивые и адаптивные инвестиционные портфели.

Исследование демонстрирует, что современные Vision-Language Models (VLMs) способны улавливать краткосрочные тенденции на графиках «свечей», однако их способность к анализу на различных временных масштабах остается ограниченной. Это подчеркивает важность разработки более комплексных моделей, способных учитывать долгосрочные паттерны и взаимосвязи. Как заметил Марвин Минский: «Лучший способ предсказать будущее — создать его». Данное исследование, по сути, является попыткой создать более надежный инструмент для прогнозирования, выявляя существующие ограничения и указывая пути для дальнейшего развития в области анализа финансовых временных рядов. Понимание этих ограничений необходимо для создания систем, способных не просто реагировать на текущие изменения, а предвидеть будущие.

Что дальше?

Представленная работа, подобно любой попытке зафиксировать динамику систем, лишь временно освещает их внутреннюю сложность. Успех моделей в прогнозировании на коротких временных горизонтах — не свидетельство понимания, а скорее, эффективное кэширование недавнего прошлого. Стабильность, которую демонстрируют эти прогнозы, — иллюзия, порожденная ограниченностью наблюдаемого временного отрезка. Всякое повышение точности на коротких отрезках лишь оттягивает неизбежное столкновение с хаосом долгосрочной динамики.

Настоящая проблема заключается не в улучшении краткосрочных прогнозов, а в разработке моделей, способных адекватно учитывать многомасштабность финансовых данных. Информация, содержащаяся в свечах, существует не изолированно, а в контексте более широких рыночных тенденций и внешних факторов. Оценка моделей, ограниченная лишь коэффициентом информации, представляется недостаточной — необходимо разрабатывать метрики, отражающие способность к адаптации и экстраполяции за пределы наблюдаемого.

В конечном счете, вопрос не в том, «читают» ли модели свечи, а в том, способны ли они воспринимать время не как линейную последовательность событий, а как среду, в которой системы непрерывно эволюционируют. Любая задержка в обработке запроса — это плата за иллюзию мгновенного знания. И чем сложнее система, тем выше этот налог.

Оригинал статьи: https://arxiv.org/pdf/2604.12659.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-16 03:34