Трафик будущего: самообучающиеся модели для умных городов

Автор: Денис Аветисян


Новый подход к прогнозированию дорожного трафика позволяет создавать персонализированные модели без ручной настройки, используя возможности федеративного обучения и адаптации к локальным условиям.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Бесплатный Телеграм канал
Сеть, представленная на рисунке, использует двухкомпонентную архитектуру: модуль обработки временных рядов на графах с кодировщиком-декодировщиком и модуль шумоподавления на основе автоэнкодера, обеспечивающий устойчивую компрессию признаков и передачу локальных представлений в глобальные посредством адаптера, направляющего матрицу запросов для декодировщика, при этом некоторые модули совместно используются различными клиентами.
Сеть, представленная на рисунке, использует двухкомпонентную архитектуру: модуль обработки временных рядов на графах с кодировщиком-декодировщиком и модуль шумоподавления на основе автоэнкодера, обеспечивающий устойчивую компрессию признаков и передачу локальных представлений в глобальные посредством адаптера, направляющего матрицу запросов для декодировщика, при этом некоторые модули совместно используются различными клиентами.

Предложена система AutoFed, использующая обучение с подсказками (prompt learning) для обмена глобальными знаниями и адаптации к не-IID данным в задачах прогнозирования трафика с применением графовых нейронных сетей и анализа временных рядов.

Прогнозирование транспортного потока критически важно для интеллектуальных транспортных систем, однако конфиденциальность данных препятствует эффективному обмену знаниями. В данной работе представлена система AutoFed: Manual-Free Federated Traffic Prediction via Personalized Prompt, новый подход к федеративному обучению, который устраняет необходимость ручной настройки гиперпараметров. AutoFed использует метод prompt learning для дистилляции локальных данных в компактную глобальную матрицу, позволяя каждому участнику извлекать пользу из коллективного опыта без ущерба для специфики. Сможет ли AutoFed стать основой для создания более эффективных и конфиденциальных систем управления транспортными потоками в реальном времени?


Неизбежность Старения: Вызовы Точного Прогнозирования Трафика

Эффективное прогнозирование дорожного движения играет ключевую роль в функционировании интеллектуальных транспортных систем (ИТС). От точности этих прогнозов напрямую зависят не только вопросы оптимизации транспортных потоков и снижения заторов, но и, что более важно, обеспечение безопасности на дорогах. Своевременное предсказание возникновения пробок или аварийных ситуаций позволяет ИТС оперативно реагировать, перенаправлять транспортные потоки и предупреждать водителей о потенциальных опасностях. Таким образом, надежное прогнозирование дорожного движения является основой для создания более эффективной, безопасной и устойчивой транспортной инфраструктуры, способствуя снижению экономических потерь и повышению качества жизни.

Традиционные централизованные модели прогнозирования дорожного движения сталкиваются с серьезными трудностями при обработке присущей реальным данным сложности и изменчивости. Эти модели, как правило, предполагают стабильность и предсказуемость транспортных потоков, однако дорожная ситуация характеризуется множеством непредсказуемых факторов — от внезапных аварий и погодных условий до поведения отдельных водителей и проведения массовых мероприятий. Попытки учесть все эти переменные в единой централизованной системе приводят к экспоненциальному росту вычислительной нагрузки и снижению точности прогнозов, поскольку модель не способна эффективно адаптироваться к постоянно меняющимся условиям. В результате, традиционные подходы часто оказываются неэффективными в динамичной и непредсказуемой среде современного городского трафика.

Проблема обеспечения конфиденциальности данных становится серьезным препятствием для создания эффективных моделей прогнозирования транспортных потоков. Сбор и передача информации о перемещении транспортных средств, необходимой для точного анализа, неизбежно затрагивает личную информацию водителей и пассажиров. Строгие правила защиты персональных данных, такие как GDPR, ограничивают возможности обмена этими сведениями между различными участниками транспортной системы — от городских властей до операторов навигационных сервисов. В результате, модели, лишенные достаточного объема данных, испытывают трудности с адаптацией к меняющимся условиям и прогнозированием транспортных заторов, что снижает их общую эффективность и ограничивает возможности улучшения транспортной инфраструктуры. Поиск баланса между необходимостью сбора данных для прогнозирования и защитой частной жизни пользователей является ключевой задачей в развитии интеллектуальных транспортных систем.

Федеративное Обучение: Сохранение Приватности в Эпоху Данных

Федеративное обучение (FL) представляет собой подход к совместной тренировке моделей машинного обучения, который позволяет обучать модель на децентрализованных данных, хранящихся на различных устройствах или серверах, без необходимости обмена этими данными. В отличие от традиционных методов, где данные централизуются для обучения, FL предполагает передачу только параметров модели (например, весов нейронной сети) между клиентами и центральным сервером. Каждый клиент локально обучает модель на своих данных, а затем отправляет обновленные параметры модели на центральный сервер, где они агрегируются для создания глобальной модели. Этот процесс повторяется итеративно, позволяя модели обучаться на большом объеме данных, сохраняя при этом конфиденциальность и безопасность этих данных. Таким образом, FL позволяет использовать данные, которые в противном случае были бы недоступны из-за нормативных ограничений или соображений конфиденциальности.

Стандартные алгоритмы федеративного обучения (FL) испытывают трудности при адаптации к разнообразным и непостоянным характеристикам транспортных потоков в различных локациях. Это связано с тем, что транспортные потоки существенно различаются по интенсивности, структуре и сезонности в зависимости от географического положения, времени суток и других факторов. Глобальная модель, обученная на усредненных данных из разных источников, может демонстрировать низкую точность и эффективность в конкретных локациях, где преобладают уникальные паттерны трафика. Непостоянство характеристик транспортных потоков, вызванное, например, дорожными работами, авариями или крупными мероприятиями, усугубляет проблему, требуя постоянной перестройки глобальной модели и снижая ее способность к обобщению.

Персонализированное федеративное обучение (PFL) является развитием стандартного федеративного обучения (FL), позволяя каждому клиенту настраивать глобальную модель под свои локальные условия и особенности данных. В отличие от FL, где все клиенты обучают идентичную глобальную модель, PFL допускает внесение изменений в архитектуру или параметры модели для улучшения производительности на конкретном устройстве или в конкретной локации. При этом, PFL сохраняет преимущества федеративного обучения, такие как конфиденциальность данных и снижение требований к централизованному хранению, поскольку обмен происходит не самими данными, а обновлениями модели, обученной на локальных данных. Такой подход позволяет учитывать гетерогенность данных и динамику трафика в различных точках сети, повышая общую точность и эффективность модели.

AutoFed: Автоматизированная Персонализация для Прогнозирования Трафика

AutoFed — это новый фреймворк федеративного обучения (PFL), разработанный специально для задач прогнозирования транспортного потока. В его архитектуре предусмотрены два основных компонента: Federated Representor (FR) и Personalized Predictor (PP). FR отвечает за извлечение и обобщение признаков из локальных данных, обеспечивая передачу обобщенной информации между участниками федеративного обучения. PP, в свою очередь, предназначен для адаптации к специфическим особенностям локальных данных и моделирования пространственно-временных зависимостей, что позволяет повысить точность прогнозирования в конкретных условиях транспортной сети. Взаимодействие FR и PP обеспечивает баланс между обобщением знаний и персонализацией моделей.

В AutoFed, Federated Representor (FR) использует комбинацию Автокодировщика (AE) и Многослойного Перцептрона (MLP) для извлечения и обмена обобщенными признаками. Автокодировщик сжимает входные данные в компактное представление, выявляя наиболее значимые характеристики дорожного трафика. Затем, Многослойный Перцептрон обрабатывает это сжатое представление для дальнейшего извлечения и обобщения признаков, обеспечивая устойчивость к различиям в локальных данных. Полученные обобщенные признаки передаются другим участникам федеративного обучения, что позволяет модели эффективно учиться на распределенных данных без необходимости обмена исходными данными о трафике.

Персонализированный предиктор (PP) в AutoFed использует адаптивные графовые рекуррентные нейронные сети (AGCRN), относящиеся к классу графовых нейронных сетей (GNN). AGCRN предназначены для моделирования сложных пространственно-временных зависимостей в данных о дорожном движении, учитывая взаимосвязи между различными участками дорожной сети. Адаптивность AGCRN достигается за счет динамической настройки весов графа в процессе обучения, что позволяет сети эффективно адаптироваться к локальным особенностям распределения данных на каждом устройстве, участвующем в федеративном обучении. Это позволяет PP более точно прогнозировать трафик, учитывая специфические паттерны и условия на конкретных участках дорожной сети, в отличие от глобальных моделей, не учитывающих локальные различия.

Использование Prompt Learning в AutoFed позволяет повысить адаптивность и эффективность модели за счет тонкой настройки процесса обучения. Вместо полной перестройки параметров, Prompt Learning добавляет небольшие, обучаемые «подсказки» (prompts) к входным данным или внутренним представлениям модели. Эти подсказки направляют модель к более эффективному использованию локальных данных и улучшению предсказаний, особенно в условиях гетерогенных данных и меняющихся паттернов трафика. Такой подход снижает вычислительные затраты и потребность в большом объеме данных для обучения, обеспечивая более быструю адаптацию к новым условиям и улучшение общей производительности системы прогнозирования трафика.

Реальные Тесты и Преимущества в Действии

Для оценки эффективности AutoFed использовались данные системы мониторинга производительности (Performance Measurement System) транспортных агентств штата Калифорния (CalTrans). Этот массив данных, включающий информацию о трафике и транспортных потоках, позволил провести всестороннее тестирование разработанного фреймворка в реальных условиях. Использование PEMS обеспечило доступ к большому объему исторических данных, что позволило точно оценить способность AutoFed к прогнозированию транспортных потоков и спроса на перевозки, а также сравнить его производительность с существующими методами в условиях, максимально приближенных к повседневной работе транспортной системы Калифорнии.

Исследования показали, что разработанная система AutoFed демонстрирует передовые результаты в задачах прогнозирования транспортного потока (TFP) и прогнозирования спроса на поездки (TDP), превосходя существующие методы в большинстве рассмотренных сценариев. Сравнение с другими алгоритмами, проведенное на данных из системы мониторинга транспорта штата Калифорния (CalTrans PEMS), выявило значительное улучшение точности и надежности прогнозов, что особенно важно для эффективного управления транспортными потоками и планирования инфраструктуры. Достигнутое превосходство в производительности указывает на перспективность применения AutoFed в реальных условиях для оптимизации транспортной системы и снижения заторов.

Исследования показали, что предложенная система AutoFed демонстрирует значительное ускорение сходимости и снижение затрат на коммуникацию по сравнению с существующими подходами в области прогнозирования транспортных потоков и спроса на перевозки. Более быстрая сходимость означает, что система быстрее достигает оптимальных решений, что критически важно для оперативного управления транспортной инфраструктурой. Снижение коммуникационных издержек, в свою очередь, позволяет эффективно масштабировать систему, особенно в сценариях с большим количеством участников и распределенных данных. Такая эффективность достигается за счет оптимизации алгоритмов обмена информацией между агентами, что ведет к уменьшению задержек и повышению общей производительности системы в реальных условиях эксплуатации.

Использование огибающих Моро \partial \phi(x) позволило значительно повысить стабильность и эффективность алгоритма Federated Learning (PFL). В рамках исследования было показано, что применение данного математического инструмента позволяет смягчить влияние выбросов и шумов в локальных данных, что особенно важно при работе с гетерогенными источниками информации. Огибающие Моро, по сути, создают «сглаженную» версию функции потерь, что способствует более плавному и надежному обучению модели. Это, в свою очередь, приводит к ускорению сходимости алгоритма и повышению точности прогнозирования транспортных потоков и спроса на перевозки, демонстрируя заметное улучшение показателей по сравнению с традиционными подходами к PFL.

Исследование, представленное в данной работе, демонстрирует стремление к созданию систем, способных к адаптации и долговечности в условиях меняющихся данных. AutoFed, как предложенный фреймворк, фокусируется на преодолении проблем, связанных с неоднородностью данных в федеративном обучении, что особенно важно для точного прогнозирования трафика. Как говорил Давид Гильберт: «Мы должны знать. Мы должны знать, что мы можем знать.» Эта фраза отражает суть подхода AutoFed — стремление к максимально полному использованию доступной информации, даже в условиях ее распределенности и различий, для создания надежных и устойчивых моделей. Данная работа подтверждает, что медленные, адаптивные изменения, а не резкие перестройки, обеспечивают долгосрочную эффективность системы.

Что дальше?

Представленная работа, стремясь к автоматизации федеративного обучения для предсказания трафика, безусловно, делает шаг к снижению ручной адаптации. Однако, иллюзия полной автоматизации часто маскирует неизбежную сложность систем. В конечном счете, любая модель, даже персонализированная, является лишь приближением к динамичной реальности. Не-IID данные, хотя и смягчаются подходом с использованием подсказок, продолжают представлять собой фундаментальную проблему — ведь время не щадит ни одну систему, и распределение данных неизбежно меняется.

В дальнейшем, следует сосредоточиться не только на адаптации к текущим отклонениям в данных, но и на предвидении их эволюции. Иногда стабильность предсказаний — это не признак точности, а лишь временная задержка перед неизбежным коллапсом. Исследования в области мета-обучения и трансферного обучения могут помочь в создании систем, способных к самообучению и адаптации в условиях меняющегося ландшафта данных, однако, стоит помнить, что даже самые сложные алгоритмы не могут обойти фундаментальные ограничения, накладываемые течением времени.

Вместо стремления к «идеальному» предсказанию, возможно, более реалистичным подходом является разработка систем, способных к грациозному старению — то есть, к постепенному снижению точности, сопровождающемуся адекватной оценкой собственной погрешности и переходом к более консервативным стратегиям. В конечном счете, все системы стареют — вопрос лишь в том, делают ли они это достойно.


Оригинал статьи: https://arxiv.org/pdf/2512.24625.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-01-04 22:21