Торговля биткоином с помощью машинного обучения: цена реальных сделок

Автор: Денис Аветисян


Новое исследование показывает, что для получения прибыли от прогнозов машинного обучения на криптовалютном рынке необходимо учитывать реальные издержки транзакций и оптимизировать частоту сделок.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал
Динамика цены BTC/USDT и почасовые логарифмические изменения демонстрируют взаимосвязь между текущей стоимостью актива и скоростью его изменения, позволяя анализировать волатильность и потенциальные тренды.
Динамика цены BTC/USDT и почасовые логарифмические изменения демонстрируют взаимосвязь между текущей стоимостью актива и скоростью его изменения, позволяя анализировать волатильность и потенциальные тренды.

Анализ эффективности алгоритмической торговли биткоином с учетом комиссий и применения фильтра для снижения затрат, основанный на методике walk-forward optimization.

Несмотря на растущий интерес к машинному обучению в трейдинге криптовалют, преобразование прогностических сигналов в реальную экономическую выгоду остается сложной задачей. В работе ‘Machine Learning-Based Bitcoin Trading Under Transaction Costs: Evidence From Walk-Forward Forecasting’ исследуется, как модели машинного обучения, такие как XGBoost, LSTM и iTransformer, могут быть использованы для торговли Bitcoin с учетом транзакционных издержек. Полученные результаты демонстрируют, что применение фильтра, учитывающего затраты на совершение сделок и минимизирующего оборачиваемость активов, является ключевым фактором для достижения прибыльности, превосходящей затраты. Смогут ли более сложные стратегии управления транзакционными издержками существенно повысить эффективность алгоритмического трейдинга криптовалют в условиях высокой волатильности?


Неуловимость Прогнозов: Ограничения Традиционных Подходов

Прогнозирование финансовых временных рядов, в частности, динамики Bitcoin (BTCUSDT), представляет собой сложную задачу из-за присущей им волатильности и нелинейности. Рынок криптовалют характеризуется резкими колебаниями цен, которые не подчиняются классическим статистическим моделям, основанным на предположении о нормальном распределении и линейной зависимости между факторами. Нелинейные зависимости означают, что даже небольшие изменения в начальных условиях могут приводить к значительным отклонениям в будущих значениях, делая долгосрочные прогнозы крайне ненадежными. Данная особенность, в сочетании с влиянием новостных событий, регуляторных изменений и настроений инвесторов, формирует сложную и непредсказуемую среду, требующую применения продвинутых методов анализа и моделирования для хоть какой-то степени достоверности прогнозов.

Традиционные методы прогнозирования волатильности, такие как модели ARCH и GARCH, часто оказываются неэффективными при анализе современных финансовых рынков, особенно в отношении криптовалют. Эти модели, разработанные для стационарных временных рядов, испытывают трудности с выявлением и адаптацией к нелинейным зависимостям и быстро меняющимся рыночным условиям. В результате, стратегии, основанные на этих прогнозах, демонстрируют неоптимальные результаты, приводя к упущенным возможностям и потенциальным убыткам. Сложность заключается в том, что рынки криптовалют характеризуются высокой степенью хаотичности, подвержены влиянию новостных событий и настроений инвесторов, что делает их поведение трудно предсказуемым при использовании стандартных статистических инструментов.

Потеря при валидации обратно пропорциональна эффективности стратегии на неиспользованных данных, что указывает на корректность обучения модели.
Потеря при валидации обратно пропорциональна эффективности стратегии на неиспользованных данных, что указывает на корректность обучения модели.

Современные Модели Прогнозирования: Сравнительный Анализ

В рамках исследования рассматриваются три различных модели прогнозирования — XGBoost, LSTM и iTransformer — каждая из которых обладает уникальными преимуществами в анализе временных рядов. XGBoost использует метод градиентного бустинга, обеспечивая надежную производительность при обработке данных. LSTM (Long Short-Term Memory) применяет рекуррентные нейронные сети для моделирования последовательных данных и учета долгосрочных зависимостей. iTransformer, в свою очередь, использует механизм внимания (attention) для эффективного выявления и использования взаимосвязей в данных, особенно на больших временных интервалах. Выбор модели определяется спецификой прогнозируемого ряда и требуемой точностью прогноза.

Модели XGBoost, LSTM и iTransformer используют различные подходы к прогнозированию временных рядов. XGBoost применяет метод градиентного бустинга, объединяя слабые модели для достижения высокой точности и устойчивости. LSTM (Long Short-Term Memory) использует рекуррентные нейронные сети, что позволяет эффективно моделировать последовательные данные и учитывать предыдущие значения ряда. iTransformer, в свою очередь, использует механизмы внимания (attention), позволяющие модели фокусироваться на наиболее важных частях последовательности и учитывать долгосрочные зависимости, что особенно полезно при анализе данных с нелинейными трендами и сезонностью.

Для повышения точности прогнозирования, рассматриваемые модели — XGBoost, LSTM и iTransformer — дополняются техническими индикаторами и моделью EGARCH. Технические индикаторы, такие как скользящие средние и индекс относительной силы (RSI), позволяют учитывать текущие рыночные сигналы и краткосрочные тренды. Модель EGARCH (Exponential GARCH) используется для моделирования волатильности, учитывая эффект «кластеризации волатильности» — тенденцию к возникновению периодов высокой и низкой волатильности. Включение EGARCH особенно важно для финансовых временных рядов, характеризующихся неравномерным распределением волатильности и склонностью к резким колебаниям.

Строгая Валидация и Оценка Производительности

Для оценки способности моделей к обобщению на новых данных используется метод WalkForwardValidation, представляющий собой разновидность кросс-валидации для временных рядов. В процессе валидации, модель обучается на начальном подмножестве данных, затем тестируется на следующем временном интервале. Этот процесс повторяется последовательно, сдвигая окно обучения и тестирования во времени. Такой подход позволяет имитировать реальные условия эксплуатации модели, где доступ к будущим данным отсутствует, и оценить ее эффективность в прогнозировании на неизвестных временных периодах, что критически важно для финансовых моделей и прогнозирования временных рядов.

Для количественной оценки производительности моделей используются следующие ключевые метрики: среднеквадратичная ошибка (MeanSquaredError), средняя абсолютная ошибка (MeanAbsoluteError), коэффициент Шарпа (SharpeRatio) и коэффициент информационного отношения (InformationRatio). MSE = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2 и MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i| позволяют оценить точность прогнозов. Коэффициент Шарпа измеряет доходность, скорректированную на риск, рассчитываясь как SR = \frac{R_p - R_f}{\sigma_p}, где R_p — доходность портфеля, R_f — безрисковая ставка, а \sigma_p — стандартное отклонение доходности портфеля. Коэффициент информационного отношения (IR) вычисляется как отношение коэффициента Шарпа к стандартному отклонению доходности и служит для оценки эффективности стратегии относительно ее риска.

Для оценки соответствия между потерей на валидационной выборке (ValidationLoss) и результатами работы модели на новых, ранее не виденных данных (out-of-sample performance), используется коэффициент корреляции Спирмена. Данный непараметрический метод позволяет определить монотонную зависимость между этими показателями, не требуя предположений о нормальном распределении данных. Высокая положительная корреляция указывает на то, что снижение ValidationLoss обычно соответствует улучшению показателей на новых данных, что подтверждает эффективность процесса обучения и валидации. Анализ корреляции Спирмена помогает в отборе наиболее перспективных моделей и уточнении параметров обучения для оптимизации обобщающей способности.

Схема прямой оптимизации позволяет последовательно улучшать стратегию управления, используя накопленный опыт для повышения эффективности.
Схема прямой оптимизации позволяет последовательно улучшать стратегию управления, используя накопленный опыт для повышения эффективности.

Влияние Транзакционных Издержек и Практическое Применение

Разработанное правило CostAwareExecution осуществляет фильтрацию торговых сделок на основе прогнозируемой величины изменений и транзакционных издержек, что позволяет оптимизировать прибыльность в реалистичной торговой среде. Данный подход учитывает не только потенциальную выгоду от сделки, но и сопутствующие расходы, такие как комиссии и проскальзывание, что особенно важно для поддержания устойчивой торговой стратегии. Фильтрация, основанная на величине прогноза, позволяет избегать незначительных сделок, которые могут быть поглощены транзакционными издержками, тем самым повышая общую эффективность торговли и снижая ненужную активность на рынке.

Данный подход позволяет существенно снизить влияние транзакционных издержек, таких как комиссии и проскальзывание, на итоговую прибыльность торговой стратегии. Минимизация этих расходов напрямую способствует повышению общей доходности и, что особенно важно, обеспечивает устойчивость стратегии в долгосрочной перспективе. Благодаря фильтрации сделок с учетом прогнозируемой величины и транзакционных издержек, достигается более эффективное использование капитала и снижение риска убытков, что делает стратегию более привлекательной для практического применения и позволяет ей адаптироваться к изменяющимся рыночным условиям.

Результаты исследования демонстрируют, что внедрение фильтра, учитывающего транзакционные издержки при исполнении сделок, позволило восстановить положительную доходность. В частности, стратегия, применяющая данный фильтр, достигла коэффициента Шарпа в 1.09, в то время как наивные стратегии приводили к убыткам. Годовая доходность (ARC) составила 65.40%, при этом наблюдалось значительное снижение частоты торговых операций (turnover). Статистический анализ подтвердил значимость улучшения доходности (p-value < 0.01), а коэффициент информационного отношения (IR*) достиг значения 1.13, что свидетельствует об эффективности предложенного подхода к управлению транзакционными издержками и оптимизации торговой стратегии.

Применение фильтрации с учетом стоимости позволяет улучшить эффективность стратегии, оптимизируя баланс между производительностью и затратами.
Применение фильтрации с учетом стоимости позволяет улучшить эффективность стратегии, оптимизируя баланс между производительностью и затратами.

Исследование демонстрирует, что машинное обучение способно генерировать сигналы для краткосрочной торговли криптовалютами, однако экономическая выгода напрямую зависит от фильтра, учитывающего транзакционные издержки и минимизирующего оборачиваемость. Этот подход подчеркивает важность самоорганизации торговых стратегий, где каждая точка взаимодействия — каждая сделка — оказывает влияние на общий результат. Как однажды заметила Мария Кюри: «Ничто в жизни не дается даром, надо упорно трудиться». Эта фраза отражает необходимость тщательной оптимизации и учета всех факторов, включая издержки, для достижения успеха в алгоритмической торговле. Порядок в этой системе не нуждается в архитекторе — он возникает из локальных правил, продиктованных необходимостью минимизации издержек и максимизации прибыли.

Куда Ведет Дорога?

Представленная работа демонстрирует закономерность, которая, впрочем, не должна удивлять: предсказательная сила алгоритмов машинного обучения в краткосрочной торговле криптовалютами оказывается недостаточной для получения прибыли без учета транзакционных издержек. Порядок не нуждается в архитекторе — он возникает из локальных правил. Необходимость фильтрации сделок, минимизирующего оборачиваемость, лишь подтверждает, что устойчивость возникает сама, её не проектируют. Стремление к оптимизации на основе исторических данных — это, по сути, попытка навязать порядок системе, которая изначально склонна к самоорганизации.

Будущие исследования, вероятно, сосредоточатся на более тонких моделях учета издержек, возможно, включая динамическое определение оптимального размера сделки или адаптацию стратегии к меняющейся ликвидности. Однако истинный прогресс, возможно, лежит в другом — в признании того, что торговые стратегии — это не отдельные алгоритмы, а сложные системы, взаимодействующие с рынком. Малые взаимодействия создают огромные сдвиги, и понимание этих взаимодействий — вот ключ к долгосрочной устойчивости.

Очевидно, что дальнейшее углубление в методы машинного обучения само по себе не гарантирует успеха. Гораздо более перспективным представляется переход от поиска «идеального» алгоритма к созданию адаптивных систем, способных извлекать выгоду из хаоса и неопределенности. Контроль — иллюзия, влияние — реально, и будущее торговых систем, вероятно, будет принадлежать тем, кто умеет влиять на рынок, а не контролировать его.


Оригинал статьи: https://arxiv.org/pdf/2606.00060.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-06-03 02:48