Умный город: Анализ трафика в реальном времени на основе камер

Автор: Денис Аветисян

Новая архитектура объединяет возможности граничных вычислений и облака для обработки видеопотоков и прогнозирования транспортной ситуации в крупных мегаполисах.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал

Разработана масштабируемая платформа тестирования и архитектура AIITS, предназначенная для обработки видеопотоков с камер наблюдения за дорожным движением в Бангалоре, что позволяет оценить возможности искусственного интеллекта в реальных условиях городской транспортной инфраструктуры.

Предлагается масштабируемая платформа для анализа данных с камер городского наблюдения с использованием графовых нейронных сетей и федеративного обучения.

Обработка растущих объемов данных от городских камер наблюдения для анализа дорожного движения представляет собой сложную задачу, требующую значительных вычислительных ресурсов и минимальной задержки. В данной работе, ‘Scaling Real-Time Traffic Analytics on Edge-Cloud Fabrics for City-Scale Camera Networks’, предложена масштабируемая платформа на основе гетерогенных вычислительных ресурсов, объединяющих возможности граничных и облачных вычислений. Разработанный подход позволяет преобразовывать потоковое видео в динамический граф дорожного движения, используя глубокие нейронные сети и графовые нейронные сети для прогнозирования трафика в режиме реального времени. Способна ли эта архитектура обеспечить эффективный и устойчивый анализ дорожной обстановки в условиях мегаполиса, такого как Бангалор, и открыть новые возможности для интеллектуальных транспортных систем?

Городской транспорт в тупике: цена прогресса

Стремительная урбанизация оказывает все более ощутимое влияние на транспортную ситуацию в городах, усугубляя проблему пробок и негативно сказываясь на качестве жизни населения. Рост числа жителей и, как следствие, увеличение автомобильного парка, приводят к перегруженности дорожной сети, что влечет за собой не только потерю времени в пути, но и ухудшение экологической обстановки. Экономические последствия также значительны: задержки в доставке грузов, снижение производительности труда из-за опозданий сотрудников и увеличение затрат на топливо — все это негативно влияет на экономический рост городов. В связи с этим, поиск эффективных решений для оптимизации транспортного потока становится приоритетной задачей для городского планирования и развития инфраструктуры.

Традиционные системы управления дорожным движением всё чаще оказываются неспособными эффективно справляться с масштабом и сложностью современных городских транспортных потоков. Разработанные для менее интенсивного движения и ограниченного количества транспортных средств, они испытывают трудности при обработке огромных объемов данных, поступающих от растущего числа автомобилей, автобусов и мотоциклов. Устаревшие алгоритмы и недостаточная вычислительная мощность не позволяют оперативно реагировать на внезапные изменения в трафике, такие как пробки, аварии или ремонтные работы. В результате, даже незначительные инциденты могут приводить к серьезным заторам и значительным потерям времени для горожан. Неспособность адаптироваться к динамично меняющейся обстановке делает существующие системы всё менее эффективными в обеспечении плавного и безопасного движения, подчеркивая необходимость разработки инновационных подходов к управлению городским транспортом.

Транспортная ситуация в Бенгалуру служит ярким примером усугубляющихся проблем современных мегаполисов. Город сталкивается с колоссальными трудностями в управлении транспортными потоками, что требует разработки принципиально новых подходов к анализу данных в реальном времени. Представленная демонстрация показывает систему, способную одновременно обрабатывать более тысячи видеопотоков с камер наблюдения, позволяя оперативно отслеживать ситуацию на дорогах и оптимизировать движение. Эта технология, способная к масштабному анализу визуальной информации, представляет собой потенциальное решение для преодоления транспортного коллапса и повышения эффективности городской инфраструктуры.

Система глубокого обучения успешно определяет классы и количество транспортных средств на сложных изображениях дорожного движения в Бангалоре.

Периферийные вычисления: перенос интеллекта к источнику данных

Периферийные вычисления (Edge Computing) представляют собой распределенный подход к обработке данных, при котором вычислительные ресурсы размещаются непосредственно вблизи источника данных — в данном случае, транспортных камер. Вместо отправки всего потока видеоданных в централизованный облачный сервер, обработка выполняется локально, непосредственно на устройствах, расположенных вблизи камер. Это позволяет минимизировать задержки, связанные с передачей данных по сети, и снижает требования к пропускной способности канала связи. Такая архитектура подразумевает развертывание вычислительных узлов, таких как специализированные серверы или встраиваемые системы, непосредственно на объектах транспортной инфраструктуры или в их непосредственной близости, обеспечивая более быструю реакцию на события и возможность обработки больших объемов данных в реальном времени.

Локализованная обработка данных, осуществляемая непосредственно на периферийных устройствах, значительно снижает задержку и требования к пропускной способности сети. Это критически важно для систем мониторинга и реагирования на дорожную обстановку в реальном времени. В текущей конфигурации, кластер периферийных вычислений обеспечивает обработку более 2000 кадров в секунду, что позволяет оперативно выявлять инциденты и оптимизировать транспортные потоки. Снижение задержки достигается за счет минимизации расстояния передачи данных от камер к вычислительным ресурсам, а уменьшение требований к пропускной способности — за счет предварительной обработки и фильтрации данных непосредственно на месте.

Развертывание аналитики на базе граничных вычислений становится масштабируемым и экономически эффективным благодаря использованию устройств, таких как ускорители Jetson и Raspberry Pi. В частности, платформа Jetson Orin AGX обеспечивает обработку приблизительно 200 кадров в секунду (FPS), что позволяет создавать отказоустойчивые и производительные системы анализа видеопотока непосредственно на месте установки камер. Использование подобных устройств снижает потребность в централизованных вычислительных ресурсах и передаче больших объемов данных, что особенно важно для приложений реального времени, таких как мониторинг дорожного движения и оперативное реагирование на инциденты.

Эксперименты показали, что производительность одноплатных компьютеров Raspberry Pi снижается при одновременной обработке 100 RTSP-потоков.

DeepStream и YOLO: инструменты для «видения» дорожной ситуации

SDK DeepStream представляет собой комплексный фреймворк, предназначенный для разработки приложений видеоаналитики с использованием искусственного интеллекта на аппаратном обеспечении Nvidia. Он включает в себя набор библиотек и инструментов, оптимизированных для эффективной обработки видеопотоков, позволяя разработчикам создавать высокопроизводительные решения для различных задач, таких как обнаружение объектов, отслеживание и классификация. Фреймворк поддерживает широкий спектр моделей машинного обучения, включая глубокие нейронные сети, и предоставляет механизмы для их развертывания и масштабирования на различных платформах Nvidia, от встраиваемых систем до серверов центров обработки данных.

В рамках платформы DeepStream, модель обнаружения объектов YOLO используется для идентификации транспортных средств в видеопотоках с высокой точностью и скоростью обработки. YOLO (You Only Look Once) применяет алгоритм однопроходного обнаружения, что позволяет анализировать каждый кадр видеопотока лишь один раз, обеспечивая высокую производительность. Алгоритм эффективно определяет границы объектов (bounding boxes) и классифицирует их, что делает возможным распознавание различных типов транспортных средств в режиме реального времени. Скорость и точность YOLO достигаются за счет использования сверточных нейронных сетей и оптимизированных вычислений на графических процессорах Nvidia.

Для достижения оптимальной производительности в условиях индийского дорожного движения, модель обнаружения объектов YOLO обучается на масштабном наборе данных UVH-26, дополняющем более общий набор COCO. Использование UVH-26, содержащего данные, специфичные для индийской дорожной обстановки, позволило добиться повышения точности обнаружения транспортных средств на 8.4 — 31.5% по сравнению с обучением исключительно на COCO. Это улучшение достигается за счет более точной идентификации объектов в сложных условиях, характерных для дорожного трафика в Индии, таких как высокая плотность движения и разнообразие типов транспортных средств.

BoT-SORT: надежное отслеживание транспортных средств в динамичной обстановке

Алгоритм BoT-SORT основывается на технологиях обнаружения объектов для отслеживания транспортных средств в последовательности видеокадров, обеспечивая надежную работу даже в сложных условиях. В отличие от традиционных методов, BoT-SORT использует комбинацию фильтра Калмана и алгоритма назначения для поддержания идентичности транспортных средств на протяжении всего видеоряда, эффективно справляясь с частичными перекрытиями, изменениями освещения и другими факторами, которые могут затруднить отслеживание. Это достигается путем прогнозирования траектории движения каждого транспортного средства и сопоставления обнаруженных объектов с существующими треками, что позволяет алгоритму не только идентифицировать транспортные средства, но и прогнозировать их дальнейшее поведение. В результате, BoT-SORT обеспечивает высокую точность и надежность отслеживания, что делает его ценным инструментом для широкого спектра приложений, включая системы «умного» транспорта и автоматизированный анализ дорожного движения.

Алгоритм BoT-SORT обеспечивает точный анализ транспортных потоков, выявление заторов и идентификацию инцидентов благодаря сохранению идентификации транспортных средств на протяжении всего видеоряда. Поддерживая непрерывное отслеживание каждого автомобиля, система способна формировать детальную картину дорожной обстановки, что позволяет не только оценивать интенсивность движения и среднюю скорость, но и оперативно реагировать на внештатные ситуации, такие как аварии или внезапные остановки. Эта возможность непрерывной идентификации критически важна для построения надежных систем интеллектуального транспорта и повышения безопасности дорожного движения, предоставляя данные, необходимые для оптимизации маршрутов и своевременного информирования участников движения.

Система, использующая алгоритм BoT-SORT, демонстрирует высокую масштабируемость и отзывчивость благодаря интеллектуальному распределению ресурсов между периферийными устройствами. Применение планирования с учетом пропускной способности позволяет эффективно использовать вычислительные мощности, обеспечивая приемлемую задержку прогнозирования ST-GNN даже при одновременной обработке данных от четырех клиентов. В ходе испытаний использовались устройства Jetson Orin AGX 64GB, которые показали увеличение объема собираемых данных в 1.2 — 5 раз по сравнению с версиями на 32GB. При этом, задержка аннотации изображений с использованием SAM3 составила всего 4.0 секунды, что подтверждает возможность оперативной обработки информации в режиме реального времени.

Исследование показывает, что даже самые передовые архитектуры, вроде edge-cloud, не застрахованы от неизбежного технического долга. Стремление к масштабируемости, к обработке тысяч видеопотоков в реальном времени, часто приводит к усложнению системы и, как следствие, к новым проблемам. Бертранд Рассел как-то заметил: «Всё существующее — это результат компромиссов, а не идеальных решений». В контексте анализа транспортных потоков, представленном в данной работе, эта фраза приобретает особую актуальность. Стремление к идеальной точности прогнозирования трафика неизбежно сталкивается с ограничениями аппаратных ресурсов и сложностью моделирования реальных городских условий. И в итоге, как обычно, практика вносит свои коррективы в самые изящные теоретические построения.

Что дальше?

Представленная работа, безусловно, демонстрирует возможность масштабирования аналитики трафика в условиях разросшейся городской инфраструктуры. Однако, оптимизация — это всегда лишь отсрочка неизбежного. За каждой элегантной архитектурой, использующей графовые нейронные сети и федеративное обучение, неизбежно возникнет проблема гетерогенности данных, устаревшего оборудования и, конечно, человеческого фактора. Камеры, как известно, не обслуживают себя сами.

Реальный город — это не тестовый стенд. С ростом масштаба неизбежно возникнут проблемы с синхронизацией данных, поддержанием консистентности моделей и, что самое неприятное, с объяснимостью принимаемых решений. Багтрекер, вероятно, начнет заполняться не ошибками в коде, а сообщениями о нелогичных прогнозах. Потому что «интеллектуальная» система, выдающая абсурдные результаты, мало чем отличается от случайного генератора чисел.

Вместо гонки за все более сложными алгоритмами, возможно, стоит обратить внимание на устойчивость системы к сбоям и ее способность к самовосстановлению. Мы не деплоим — мы отпускаем систему в дикую среду. И в этой среде, как известно, выживает не самый умный, а самый приспособленный. Вопрос не в том, как предсказать трафик, а в том, как смириться с его непредсказуемостью.

Оригинал статьи: https://arxiv.org/pdf/2603.05217.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-08 18:41