Выявление мошенничества на криптовалютных рынках: новый подход

Автор: Денис Аветисян

Исследователи предлагают инновационную систему обнаружения схем «накачки и сброса» на основе анализа связей между криптовалютами и динамики рыночных данных.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

В статье представлен фреймворк, использующий графовые нейронные сети и пространственно-временное моделирование для повышения точности выявления мошеннических действий даже при ограниченной информации.

Несмотря на растущую популярность криптовалютных рынков, существующие механизмы выявления мошеннических схем зачастую игнорируют взаимосвязи между активами. В работе ‘Fraud Detection in Cryptocurrency Markets with Spatio-Temporal Graph Neural Networks’ предложен подход, использующий графовые нейронные сети для анализа рыночных данных и выявления скоординированных манипуляций. Показано, что модели, учитывающие сетевую структуру рынка, значительно превосходят традиционные методы машинного обучения в обнаружении аномальных событий, таких как схемы «pump-and-dump». Способны ли подобные подходы выявить более сложные формы рыночного обмана и обеспечить более надежную защиту инвесторов?

Рынок как поле боя: манипуляции и их последствия

Финансовые рынки, несмотря на все механизмы регулирования, остаются уязвимыми для манипуляций, что создает неравные условия для участников и подрывает доверие инвесторов. Искусственное завышение или занижение цен на активы, распространение ложной информации и иные недобросовестные практики позволяют отдельным лицам или группам получать незаконную прибыль за счет других. Эта проблема не ограничивается лишь отдельными случаями мошенничества; систематические манипуляции приводят к искажению рыночных сигналов, препятствуют эффективному распределению капитала и в конечном итоге негативно сказываются на всей экономике. Потеря доверия к справедливости и прозрачности рынков может привести к оттоку инвестиций и снижению экономического роста, подчеркивая важность разработки и внедрения эффективных механизмов обнаружения и пресечения подобных действий.

Традиционные методы выявления мошеннических действий на финансовых рынках часто оказываются неэффективными при обнаружении сложных схем, таких как “pump and dump”. Эти схемы характеризуются не единичными, а последовательными, во времени распределенными манипуляциями, что делает их трудноуловимыми для систем, ориентированных на статические признаки. Проблемой является то, что мошенники намеренно создают иллюзию спроса, постепенно повышая цену актива, а затем избавляются от него, оставляя инвесторов с обесценившимися активами. Для успешного выявления таких схем требуется анализ не только текущих рыночных данных, но и динамики взаимосвязей между активами, а также отслеживание эволюции моделей торгового поведения во времени, что значительно превосходит возможности стандартных алгоритмов обнаружения аномалий.

Схемы манипулирования рынком, в частности, подобные «накачке и сбросу», базируются на скоординированных действиях группы лиц, стремящихся искусственно завысить или занизить стоимость активов. Вместо грубых и очевидных махинаций, манипуляторы используют тонкие искажения цен и объемов торгов, которые трудно отличить от естественных колебаний рынка. Это достигается путем создания иллюзии повышенного спроса или предложения, что привлекает неопытных инвесторов, в то время как организаторы схемы постепенно избавляются от активов по завышенной цене. Суть подобных действий заключается не в одномоментном обмане, а в создании устойчивого, пусть и ложного, тренда, эксплуатирующего психологию массового поведения и стремление к быстрой прибыли.

Для эффективного выявления манипуляций на финансовых рынках недостаточно анализа отдельных активов; требуется комплексный подход, учитывающий взаимосвязи между ними и динамику торговых стратегий. Исследования показывают, что манипуляторы часто используют сложные схемы, воздействуя на несколько активов одновременно, чтобы замаскировать свою деятельность. Поэтому, современные системы обнаружения мошенничества фокусируются на выявлении не только аномальных объемов торгов или резких колебаний цен, но и на отслеживании изменений в корреляциях между активами, а также на распознавании паттернов в последовательности сделок. Учет эволюции торгового поведения, то есть способности системы адаптироваться к новым тактикам манипуляторов, является ключевым фактором в обеспечении надежной защиты инвесторов и поддержании целостности рынка.

Пространственно-временные графы: взгляд сквозь призму взаимосвязей

Представлена пространственно-временная графовая нейронная сеть (STGNN), предназначенная для моделирования сложных взаимосвязей между активами и временных зависимостей в финансовых данных. Архитектура STGNN позволяет учитывать не только статические связи между активами, но и динамически изменяющиеся отношения во времени. В основе сети лежит представление активов как узлов графа, а взаимодействий между ними — как ребер. Обработка информации осуществляется посредством многослойных графовых сверток, учитывающих как структурные особенности графа (отношения между активами), так и временные характеристики данных, что позволяет выявлять закономерности, не улавливаемые традиционными методами анализа временных рядов. $G = (V, E)$ , где $V$ — множество узлов (активов), а $E$ — множество ребер, отражающих взаимосвязи.

В архитектуре модели используются различные методы построения графа, включающие в себя статический граф корреляции и динамический граф корреляции. Статический граф корреляции формируется на основе исторических данных и отражает начальные взаимосвязи между активами. Динамический граф корреляции, в свою очередь, пересчитывается периодически с использованием текущих рыночных данных, что позволяет модели адаптироваться к изменяющимся взаимосвязям и учитывать временные зависимости между активами. Пересчет динамического графа осуществляется на основе скользящего окна данных, что обеспечивает реагирование на недавние изменения рыночной динамики и повышает точность прогнозирования.

Модель использует метод самоадаптирующейся матрицы смежности (Self-Adaptive Adjacency), основанный на векторных представлениях узлов (Node Embeddings), для динамического определения релевантных связей между активами. Векторные представления узлов, полученные в процессе обучения, используются для вычисления весов между узлами графа. Эти веса определяют силу связи между активами и позволяют модели автоматически адаптировать структуру графа к изменяющимся рыночным условиям, фокусируясь на наиболее значимых взаимосвязях, определенных непосредственно данными, а не заданных заранее правилами или экспертными оценками. В результате, модель способна выявлять скрытые зависимости и паттерны, которые могут быть пропущены при использовании статических или фиксированных графовых структур.

Целью использования комбинированного пространственно-временного анализа является преодоление ограничений традиционной разработки признаков (feature engineering) при выявлении мошеннических операций. Традиционные методы часто полагаются на предварительно заданные правила и статичные признаки, что делает их уязвимыми к адаптации мошенников. Предлагаемый подход, напротив, позволяет модели автоматически извлекать и учитывать сложные взаимосвязи между активами и изменения во времени, что способствует выявлению более тонких и неявных паттернов, указывающих на мошенничество. Это достигается за счет одновременного анализа структуры связей между объектами (пространственная информация) и динамики этих связей во времени (временная информация), что позволяет модели адаптироваться к меняющимся условиям и выявлять аномалии, которые могли бы остаться незамеченными при использовании статических признаков.

Временные трансформаторы: улавливая дуновение времени

В основе нашей модели лежит Временной Трансформерный Энкодер, предназначенный для обработки последовательных данных OHLCV (Open, High, Low, Close, Volume) и выявления временных закономерностей, указывающих на потенциальные манипуляции. Этот энкодер анализирует последовательности данных, представляющих собой историю изменений цены открытия, максимальной, минимальной цены закрытия и объема торгов, для определения аномальных корреляций и паттернов, которые могут свидетельствовать о скоординированных попытках повлиять на рынок. Обработка данных OHLCV позволяет модели учитывать как ценовые колебания, так и активность торгов, что необходимо для точной идентификации манипулятивных схем.

В основе работы энкодера лежит механизм внимания (Attention Mechanism), позволяющий сети динамически оценивать важность различных временных шагов и признаков OHLCV (Open, High, Low, Close, Volume) при анализе рисков. Вместо обработки всей последовательности данных одинаково, механизм внимания присваивает каждому временному шагу и признаку вес, отражающий его релевантность для текущей задачи оценки риска. Более высокие веса указывают на большую значимость, что позволяет модели сосредоточиться на наиболее информативных данных и игнорировать шум. Этот процесс происходит путем вычисления взвешенной суммы представлений различных временных шагов и признаков, где веса определяются на основе их взаимосвязи и вклада в итоговый результат.

Использование передовых методов, таких как `Temporal Transformer Encoder` и механизм внимания, позволяет нашей сети улавливать изменяющуюся динамику торговых объемов и ценовых движений. Данная архитектура позволяет модели не просто фиксировать текущие значения `OHLCV Data` (Open, High, Low, Close, Volume), но и анализировать их последовательную взаимосвязь во времени. Это достигается путем учета контекста каждого временного шага и определения наиболее значимых моментов, влияющих на изменение рыночной ситуации. В результате сеть способна выявлять сложные паттерны и тренды, которые могли бы остаться незамеченными при использовании традиционных методов анализа.

Понимание временных зависимостей в данных биржевой торговли критически важно для разграничения легитимной рыночной активности и скоординированных манипуляций. Анализ последовательности данных OHLCV (Open, High, Low, Close, Volume) позволяет выявить неслучайные корреляции и аномалии, указывающие на искусственное воздействие на цены или объемы торгов. Отсутствие учета временных связей может привести к ложным срабатываниям и неспособности выявить сложные схемы манипулирования, в то время как точное определение этих зависимостей повышает эффективность обнаружения и предотвращения неправомерных действий на рынке.

Превосходная точность и широкие перспективы

Разработанная пространственно-временная графовая нейронная сеть демонстрирует стабильное превосходство над традиционными методами, такими как XGBoost и Random Forests, в обнаружении схем “накачки и сброса” (pump-and-dump). На реальном наборе данных модель достигает показателя F1 в 0.62 ± 0.05, что свидетельствует о значительно более высокой точности выявления манипуляций на рынке. Данный результат подтверждает эффективность использования графовых нейронных сетей для анализа сложных взаимосвязей между участниками рынка и выявления аномальной активности, что позволяет более надежно идентифицировать и предотвращать мошеннические схемы.

Результаты экспериментов демонстрируют значительное превосходство разработанной модели в обнаружении манипулятивных схем. В частности, значение метрики F1-score, достигнутое моделью, составило 0.62, что существенно превышает показатели, полученные с использованием алгоритмов XGBoost (0.49) и Random Forests (0.53). Данное улучшение свидетельствует о более высокой точности и эффективности предложенного подхода в выявлении аномалий на финансовых рынках, что позволяет надежнее идентифицировать потенциальные случаи мошенничества и манипулирования ценами.

Исследование показало, что модель ST-GNN, использующая статический граф, достигла показателя F1 в 0.60, в то время как динамическая версия ST-GNN, использующая динамический граф, продемонстрировала результат 0.58. Несмотря на незначительную разницу в значениях, полученные данные подтверждают эффективность самоадаптирующегося подхода, используемого в модели. Такой подход позволяет учитывать изменяющуюся структуру взаимосвязей между токенами, что, в свою очередь, повышает точность обнаружения манипуляций на рынке и подчеркивает потенциал для дальнейшей оптимизации и улучшения производительности системы.

Анализ кривых Precision-Recall продемонстрировал значительное превосходство графовых моделей над традиционными методами, основанными на деревьях решений. В ходе исследования было установлено, что применение графовых нейронных сетей позволило сместить границу PR-фронтира вверх, что свидетельствует о повышении точности и полноты обнаружения манипулятивных схем. Это означает, что модели, использующие графовое представление данных, способны более эффективно отличать реальные случаи мошенничества от нормальной рыночной активности, снижая количество ложных срабатываний и пропущенных инцидентов. Такой сдвиг PR-фронтира указывает на существенное улучшение способности моделей к обобщению и адаптации к новым, ранее не встречавшимся сценариям, что крайне важно для эффективной борьбы с финансовым мошенничеством.

Исследование продемонстрировало выдающиеся результаты самоадаптирующейся модели ST-GNN при выявлении манипуляций на рынке криптовалют. В частности, при анализе токенов, подвергшихся как минимум пяти эпизодам искусственной накачки (pump events), модель достигла показателя F1-score в 0.808 (APPC) и 0.931 (NXS). Это свидетельствует о высокой эффективности предложенного подхода в распознавании сложных схем манипулирования, характеризующихся повторяющимися циклами накачки и сброса, и подтверждает способность модели адаптироваться к динамично меняющимся паттернам поведения на рынке.

Разработанный подход, обеспечивая более точное и оперативное выявление мошеннических схем, способствует укреплению целостности финансовых рынков и защите интересов инвесторов. Своевременное обнаружение манипуляций, таких как схемы «накачки и сброса», позволяет минимизировать финансовые потери и поддерживать доверие к торговым площадкам. Повышенная точность прогнозирования, достигнутая благодаря использованию графовых нейронных сетей, позволяет выявлять даже скрытые и сложные схемы, которые остаются незамеченными традиционными методами анализа. В конечном итоге, это приводит к более стабильной и прозрачной рыночной среде, где инвесторы могут принимать обоснованные решения, не опасаясь недобросовестных практик.

Перспективы развития данной исследовательской работы включают в себя расширение области применения разработанной структуры для выявления других видов финансовых преступлений, таких как инсайдерская торговля и манипулирование рынком. Особое внимание планируется уделить интеграции потоковых данных в режиме реального времени, что позволит значительно повысить оперативность обнаружения мошеннических схем и минимизировать потенциальные убытки для инвесторов. Это предполагает разработку алгоритмов, способных обрабатывать и анализировать большие объемы данных, поступающих от различных источников, таких как биржевые котировки, новостные ленты и социальные сети, для выявления аномалий и подозрительных транзакций. Внедрение данных в реальном времени позволит перейти от реактивного обнаружения мошенничества к проактивному предотвращению, что существенно повысит эффективность борьбы с финансовыми преступлениями.

Исследование показывает, что даже агрегированные рыночные данные могут быть использованы для выявления манипуляций, если правильно применить инструменты анализа графов. Авторы предлагают подход, основанный на построении графа связей между криптовалютами и применении к нему графовых нейронных сетей для обнаружения схем «накачки и сброса». В этом есть горькая ирония: сложные алгоритмы призваны выявлять закономерности в хаосе, созданном другими людьми. Как заметил Брайан Керниган: «Отладка — это как быть детективом в стране, которую вы создали сами». Действительно, выявление мошенничества в криптовалютах — это попытка разобраться в сложном лабиринте взаимосвязей, где каждый новый элемент может изменить всю картину. И, как обычно бывает, элегантная теория столкнётся с суровой реальностью, ведь проджект всегда найдёт способ сломать даже самую продуманную модель.

Что дальше?

Предложенный подход, безусловно, добавляет ещё один слой сложности в вечную борьбу с мошенничеством на криптовалютных рынках. Однако, стоит помнить: каждая элегантная модель — это всего лишь временное облегчение, пока рынок не найдёт способ её обойти. Графовые нейронные сети, безусловно, способны улавливать сложные взаимосвязи, но предсказать человеческую жадность и изобретательность — задача куда сложнее. Особенно учитывая, что схема «накачки и сброса» постоянно эволюционирует, адаптируясь к новым инструментам и регуляциям.

Будущие исследования, вероятно, будут сосредоточены на интеграции дополнительных источников данных — не только рыночных, но и социальных сетей, форумов, даркнета. Но даже тогда, идеальной защиты не будет. Важнее не столько построить систему, которая обнаруживает все схемы, сколько создать инструменты, которые позволят быстро реагировать на возникающие угрозы и минимизировать ущерб. Иначе говоря, переходить от «предотвращения» к «адаптации».

В конечном итоге, эта работа — ещё один шаг в бесконечном цикле: разработка алгоритма, его взлом, разработка нового алгоритма. Тесты — это форма надежды, а не уверенности. И рано или поздно, кто-нибудь напишет скрипт, который упадёт в прод, и все эти красивые графы окажутся бесполезными.

Оригинал статьи: https://arxiv.org/pdf/2604.24590.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-28 20:39