Обнаружение аномалий траекторий: новый подход с использованием контрастного обучения и обучения с подкреплением

Автор: Денис Аветисян


В статье представлена инновационная система для выявления необычного поведения в данных о перемещениях, сочетающая в себе возможности контрастного обучения и глубокого обучения с подкреплением.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Бесплатный Телеграм канал
Общая структура CroTad демонстрирует комплексный подход к задаче, позволяя эффективно организовывать и интегрировать различные компоненты системы для достижения поставленной цели.
Общая структура CroTad демонстрирует комплексный подход к задаче, позволяя эффективно организовывать и интегрировать различные компоненты системы для достижения поставленной цели.

Предложенный фреймворк CroTad обеспечивает точное и эффективное обнаружение аномальных подтраекторий в режиме реального времени, демонстрируя превосходные результаты на данных о транспортных потоках.

Обнаружение аномалий в траекториях движения является важной задачей в современных интеллектуальных транспортных системах, однако существующие подходы часто сталкиваются с трудностями при обработке нерегулярных данных и требуют тщательной настройки параметров. В данной работе представлена новая платформа CroTad: A Contrastive Reinforcement Learning Framework for Online Trajectory Anomaly Detection, использующая контрастное обучение и обучение с подкреплением для выявления аномальных сегментов траекторий в режиме реального времени. Предложенный подход позволяет формировать устойчивые представления о нормальном движении и эффективно отличать аномальное поведение как на уровне отдельных точек, так и на уровне под-траекторий. Сможет ли CroTad стать основой для создания более надежных и адаптивных систем управления транспортными потоками?


Неуловимость Аномалий: Вызов для Современных Систем

Выявление аномальных траекторий движения представляет собой сложную задачу, имеющую критическое значение для разнообразных приложений, включая обнаружение мошеннических действий и оптимизацию транспортных потоков. Сложность обусловлена не только огромными объемами данных, но и многообразием факторов, влияющих на траекторию — от предсказуемых изменений в скорости и направлении до внезапных отклонений, вызванных нештатными ситуациями. Идентификация таких отклонений требует разработки алгоритмов, способных эффективно обрабатывать шумные данные, учитывать контекст движения и адаптироваться к меняющимся условиям окружающей среды. Неспособность точно выявлять аномалии может привести к серьезным последствиям, начиная от финансовых потерь и заканчивая угрозой безопасности.

Традиционные методы обнаружения аномалий, такие как DBSCAN, часто оказываются неэффективными при работе с реальными траекторными данными, характеризующимися высокой сложностью и масштабом. Проблема заключается в том, что алгоритмы, успешно работающие с небольшими и простыми наборами данных, испытывают трудности при обработке огромных объемов информации, содержащих шум, нерегулярности и разнообразные паттерны движения. Например, определение плотности точек, необходимое для работы DBSCAN, становится вычислительно затратным и неточным в условиях неравномерного распределения данных. Кроме того, алгоритм чувствителен к выбору параметров, и оптимальные значения для одного набора данных могут оказаться неприменимыми к другому, что требует трудоемкой настройки и адаптации. В результате, использование DBSCAN и подобных методов часто приводит к большому количеству ложных срабатываний или, наоборот, к пропуску реальных аномалий в сложных траекторных данных.

Существующие подходы к обнаружению аномалий в траекториях, основанные на рекуррентных нейронных сетях (например, автоэнкодеры SAE) и вариационных автоэнкодерах (VSAE), представляют собой первые шаги в решении данной задачи, однако демонстрируют недостаточную устойчивость в сложных сценариях. Эти модели, хоть и способны улавливать общие закономерности в данных, часто терпят неудачу при столкновении с шумом, неполнотой данных или появлением новых, ранее не встречавшихся типов аномального поведения. Проблема заключается в том, что стандартные архитектуры SAE и VSAE не всегда способны эффективно моделировать сложные временные зависимости и учитывать контекст траектории, что приводит к ложным срабатываниям или, наоборот, к пропуску реальных аномалий. Для повышения надежности требуется разработка более продвинутых моделей, способных адаптироваться к изменяющимся условиям и учитывать различные факторы, влияющие на движение объектов.

Аномальные участки траекторий (красные пунктирные линии) выявляются системой на основе сравнения с эталонными маршрутами (черные линии) и нормальными участками (синие линии) в транспортной сети Translink.
Аномальные участки траекторий (красные пунктирные линии) выявляются системой на основе сравнения с эталонными маршрутами (черные линии) и нормальными участками (синие линии) в транспортной сети Translink.

Улучшение Представления Траекторий с Помощью Продвинутых Моделей

Модели, такие как GM-VSAE и DeepTEA, повышают точность обнаружения аномалий за счет интеграции Гауссовых Смешанных Моделей (Gaussian Mixture Models, GMM) и учета временных условий трафика. Использование GMM позволяет эффективно моделировать распределение вероятностей траекторий, что особенно важно для выявления отклонений от нормального поведения. Включение информации о временных условиях, таких как загруженность дорог в определенное время суток, дополнительно улучшает качество представления траекторий и повышает устойчивость моделей к шумам и вариациям, обеспечивая более надежное обнаружение аномалий в динамически меняющейся среде.

Несмотря на улучшения в обнаружении аномалий, достигаемые моделями, такими как GM-VSAE и DeepTEA, эффективность этих подходов ограничена недостаточным учетом пространственных взаимосвязей в данных о траекториях. Традиционные методы часто рассматривают каждую траекторию изолированно, игнорируя информацию о близости маршрутов и частоте их использования другими участниками движения. Более глубокое понимание того, как траектории связаны друг с другом в пространстве, позволяет выявлять отклонения от нормального поведения, обусловленные, например, изменениями в транспортном потоке или возникновением препятствий. Анализ пространственных отношений способствует повышению точности и надежности систем обнаружения аномалий, особенно в условиях высокой плотности движения.

Сети внимания на графах (GAT) представляют собой эффективный инструмент для моделирования пространственных взаимосвязей в данных о траекториях. В основе подхода лежит встраивание ячеек (cells) на основе часто посещаемых маршрутов, известное как Route-Wise Graph Embedding. Этот метод создает более насыщенные представления, учитывая не только текущее положение, но и контекст, определяемый популярными траекториями. Построение графа происходит на основе частоты совместного использования участков маршрутов, где узлы соответствуют ячейкам, а ребра — связи между ними, взвешенные по частоте совместного посещения. Применение механизма внимания позволяет моделировать важность различных соседних ячеек при формировании представления текущей ячейки, что повышает точность анализа траекторий и обнаружения аномалий.

Кластеризация и извлеченные маршруты для различных пар пунктов отправления и назначения на Translink и PortobyCroTad демонстрируют эффективность предложенного подхода.
Кластеризация и извлеченные маршруты для различных пар пунктов отправления и назначения на Translink и PortobyCroTad демонстрируют эффективность предложенного подхода.

CroTad: Структура для Онлайн-Обнаружения Аномалий

CroTad представляет собой новую структуру для онлайн-обнаружения аномалий траекторий, объединяющую контрастное обучение и глубокое обучение с подкреплением (Deep Reinforcement Learning). В основе подхода лежит использование контрастивных представлений для улучшения качества входных данных для агента обучения с подкреплением. В результате, CroTad демонстрирует передовые показатели в обнаружении аномальных траекторий, превосходя существующие методы по ключевым метрикам, что подтверждается экспериментальными данными и позволяет в режиме реального времени выявлять отклонения от нормального поведения.

В основе CroTad лежит использование сети глубокого обучения Q-функций (DQN) для формирования устойчивой политики обнаружения аномалий. Обучение DQN осуществляется на псевдо-размеченных данных с применением специально разработанной смещенной функции вознаграждения (Biased Reward Function). Эта функция вознаграждения позволяет DQN эффективно различать нормальное и аномальное поведение траекторий, даже при наличии шума или неполных данных, обеспечивая более точное и надежное обнаружение аномалий в режиме реального времени. Смещение в функции вознаграждения нацелено на оптимизацию политики в пользу раннего обнаружения аномалий, минимизируя ложноотрицательные результаты.

В рамках разработанного фреймворка CroTad реализована возможность обнаружения аномальных траекторий в режиме реального времени (Online Detection), что критически важно для своевременного вмешательства и повышения общей производительности системы. Экспериментальные результаты демонстрируют превосходство CroTad над существующими методами: достигнут наивысший показатель F1-Score на уровне отдельных точек данных, подтверждающий эффективность предложенного подхода в задачах оперативного выявления отклонений от нормального поведения траекторий.

Подтверждение Эффективности и Широкая Применимость Фреймворка

Для подтверждения эффективности разработанной системы CroTad, её работоспособность была протестирована на реальных данных из городов Порту и Брисбен. Использование разнородных наборов данных — Porto Dataset и Translink Dataset — позволило продемонстрировать адаптивность системы к различным городским условиям и особенностям транспортных потоков. Успешное функционирование CroTad в этих двух существенно отличающихся друг от друга городских средах подтверждает её универсальность и потенциал для применения в широком спектре интеллектуальных транспортных систем, вне зависимости от специфики городской инфраструктуры и паттернов мобильности населения.

Внедрение системы H3-индексирования значительно повышает эффективность и масштабируемость разработанной платформы. Эта геопространственная система, основанная на икосаэдрической дискретизации сферы, позволяет разбивать земную поверхность на ячейки различных размеров и уровней детализации. Благодаря этому, обработка больших объемов данных о перемещениях, характерных для современных транспортных систем, становится существенно быстрее и эффективнее. Использование H3 позволяет не только оптимизировать хранение и поиск данных, но и упрощает алгоритмы анализа аномалий, обеспечивая возможность масштабирования системы для работы с данными, охватывающими целые города и даже регионы. Такой подход открывает перспективы для создания интеллектуальных транспортных систем, способных оперативно реагировать на изменения в транспортном потоке и повышать общую безопасность и эффективность перевозок.

Разработанная технология имеет значительный потенциал применения в различных областях, включая интеллектуальные транспортные системы и обнаружение мошеннических операций, а также в любых задачах, требующих выявления аномалий в режиме реального времени. В ходе тестирования CroTad продемонстрировал впечатляющее улучшение способности к шумоподавлению на 110.29% по сравнению с существующими методами, что свидетельствует о его высокой эффективности. Кроме того, система достигла наивысшего показателя F1-Score на уровне окна, подтверждая ее способность к точной и надежной идентификации аномальных событий и предоставляя возможности для повышения эффективности и безопасности в широком спектре приложений.

Анализ окон на уровне точек данных в наборе Portodata позволяет выявить закономерности и тенденции.
Анализ окон на уровне точек данных в наборе Portodata позволяет выявить закономерности и тенденции.

Исследование, представленное в данной работе, демонстрирует стремление к созданию систем, способных адаптироваться к динамично меняющимся условиям. Подход CroTad, объединяющий контрастное обучение и обучение с подкреплением, направлен на выявление аномалий в траекториях в режиме реального времени. В этом контексте, слова Роберта Тарьяна: «Архитектура без истории — хрупка и скоротечна», особенно актуальны. Подобно тому, как исторические данные формируют понимание системы, CroTad использует контрастное обучение для создания надежного представления о нормальном поведении, что позволяет более эффективно обнаруживать отклонения и, тем самым, повышает устойчивость системы к неожиданным событиям. Устойчивость и адаптивность — ключевые характеристики систем, способных выдержать испытание временем.

Что впереди?

Представленный подход, демонстрируя способность к выявлению аномалий в траекториях, лишь слегка приоткрывает завесу над сложной динамикой систем. Вместо стремления к немедленному «исправлению» отклонений, более мудрым представляется наблюдение за тем, как система учится адаптироваться к новым условиям, как энтропия становится не препятствием, а частью процесса. Очевидно, что существующие метрики оценки не всегда способны уловить тонкие изменения в поведении системы, и поиск более тонких индикаторов — задача, требующая неспешного анализа.

Ограничения текущих моделей в обработке долгосрочных зависимостей и неполноты данных остаются актуальными. Вместо того чтобы усложнять алгоритмы, пытаясь предсказать все возможные сценарии, возможно, стоит сосредоточиться на создании систем, способных к самообучению и адаптации в реальном времени. Иногда наблюдение — единственная форма участия, позволяющая системе «созреть» и выработать собственные стратегии.

Будущие исследования могут быть направлены на интеграцию методов контрастивного обучения с более сложными моделями усиленного обучения, способными учитывать контекст и взаимосвязи между различными элементами системы. Однако, стоит помнить: все системы стареют, вопрос лишь в том, делают ли они это достойно. И порой, лучшим решением является позволить системе учиться стареть достойно, а не пытаться ускорить процесс.


Оригинал статьи: https://arxiv.org/pdf/2511.16929.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-24 19:28