Роботы учатся замечать неладное: новый подход к обнаружению аномалий

Автор: Денис Аветисян


Исследователи разработали систему, позволяющую роботам отслеживать выполнение задач и вовремя выявлять отклонения от нормального поведения в реальном времени.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал
Роботизированная система мониторинга, основанная на потоковой нормализации (RC-NF), анализирует видеопоток для извлечения масок объектов, кодирует запросы задач и данные о состоянии робота, используя эти сигналы в аффинных слоях RCPQNet для вычисления аномалий и инициирования корректирующих действий - перепланировки задач на уровне задач и отката состояния на уровне состояний - при превышении порогового значения аномалии.
Роботизированная система мониторинга, основанная на потоковой нормализации (RC-NF), анализирует видеопоток для извлечения масок объектов, кодирует запросы задач и данные о состоянии робота, используя эти сигналы в аффинных слоях RCPQNet для вычисления аномалий и инициирования корректирующих действий — перепланировки задач на уровне задач и отката состояния на уровне состояний — при превышении порогового значения аномалии.

Представлена модель Robot-Conditioned Normalizing Flow (RC-NF) для обнаружения аномалий в задачах манипулирования роботами, основанная на объединении Vision-Language-Action моделей и нормализующих потоков.

Несмотря на значительные успехи в обучении роботов выполнению сложных задач с использованием моделей «Видение-Язык-Действие», их надежность в динамичных средах остается проблемой, особенно при столкновении с нештатными ситуациями. В данной работе, представленной под названием ‘RC-NF: Robot-Conditioned Normalizing Flow for Real-Time Anomaly Detection in Robotic Manipulation’, предлагается новый подход к мониторингу аномалий в задачах манипулирования роботом, основанный на потоке нормализации, обусловленном состоянием робота и объекта. Разработанная модель RC-NF позволяет в режиме реального времени выявлять отклонения от нормального поведения, обеспечивая возможность своевременного вмешательства или перепланирования задачи с задержкой менее 100 мс. Сможет ли RC-NF стать ключевым компонентом для создания действительно адаптивных и устойчивых роботизированных систем, способных эффективно функционировать в непредсказуемых условиях?


Понимание Неопределенности: Вызовы в Робототехническом Восприятии

Современные робототехнические системы, функционирующие на основе моделей «Зрение-Язык-Действие», демонстрируют уязвимость при столкновении с непредсказуемыми ситуациями или данными, выходящими за рамки их тренировочного опыта. Это связано с тем, что такие модели, хоть и способны к выполнению сложных задач в знакомых условиях, зачастую не обладают достаточной устойчивостью к отклонениям от ожидаемого. Несмотря на кажущуюся интеллектуальность, системы могут давать сбой или принимать неверные решения, если сталкиваются с чем-то, что не было предусмотрено в процессе обучения. Данная особенность подчеркивает необходимость разработки более надежных и адаптивных алгоритмов, способных эффективно справляться с неопределенностью реального мира и обеспечивать безотказную работу роботов в различных условиях.

Современные роботизированные системы, основанные на моделях «Видение-Язык-Действие», демонстрируют впечатляющие возможности, однако их надежность в реальных условиях эксплуатации остается проблемой. Несмотря на способность успешно выполнять задачи в заранее определенных сценариях, эти модели зачастую оказываются уязвимыми при столкновении с неожиданными ситуациями или данными, выходящими за рамки тренировочного набора. Отсутствие внутренней устойчивости к отклонениям требует разработки эффективных методов обнаружения аномалий — тех самых отклонений, которые могут привести к ошибкам или даже к отказу системы. Выявление таких аномалий позволяет роботизированной системе не только констатировать факт нештатной ситуации, но и предпринять корректирующие действия, обеспечивая тем самым более безопасную и надежную работу в динамичной и непредсказуемой среде.

Традиционные методы обнаружения аномалий в работе роботов часто оказываются неэффективными при столкновении с незначительными отклонениями от ожидаемого поведения. Существующие алгоритмы, как правило, настроены на выявление грубых нарушений, игнорируя едва заметные изменения в данных, которые, тем не менее, могут сигнализировать о надвигающейся проблеме или неверной интерпретации окружающей среды. Это ограничивает способность робота адаптироваться к новым, непредсказуемым ситуациям и своевременно восстанавливаться после ошибок, поскольку даже небольшие отклонения могут накапливаться и приводить к серьезным последствиям в реальном мире. В результате, робот, полагающийся на такие методы, может продолжать действовать некорректно, не осознавая возникшей проблемы, что снижает его надежность и безопасность в динамичных условиях.

Визуальные языковые модели (VLMs) используются для оценки аномалий, обнаруженных роботом.
Визуальные языковые модели (VLMs) используются для оценки аномалий, обнаруженных роботом.

Моделирование Нормальности с Помощью Нормализующих Потоков, Обусловленных Роботом

Предлагается модель Robot-Conditioned Normalizing Flow (RC-NF) — генеративная модель, предназначенная для изучения распределения вероятностей ожидаемых состояний и траекторий робота. RC-NF позволяет создавать вероятностное представление о возможных будущих состояниях робота, учитывая его текущее состояние и планируемые действия. Основываясь на принципах нормализующих потоков, модель преобразует простое априорное распределение в сложное распределение, описывающее поведение робота. Это достигается путем применения последовательности обратимых преобразований к входным данным, что позволяет эффективно оценивать плотность вероятности и генерировать реалистичные траектории. Модель способна моделировать как дискретные, так и непрерывные переменные, что необходимо для представления различных аспектов поведения робота, включая углы суставов, скорости и положения в пространстве.

Модель RC-NF базируется на установленном фреймворке нормализующих потоков (Normalizing Flows), представляющем собой мощный механизм для моделирования сложных зависимостей в поведении роботов. Нормализующие потоки позволяют преобразовывать простое распределение вероятностей, такое как гауссовское, в сложное распределение, описывающее данные, сохраняя при этом возможность вычисления вероятности любого состояния. Использование нормализующих потоков позволяет RC-NF эффективно захватывать нелинейные взаимосвязи между состоянием робота, параметрами задачи и окружением, что необходимо для точного моделирования и прогнозирования поведения робота в различных сценариях. В отличие от традиционных методов, требующих ручного проектирования признаков, нормализующие потоки автоматически изучают сложные представления данных, повышая гибкость и обобщающую способность модели.

Модель RC-NF использует информацию о состоянии робота, векторные представления задачи (task embeddings) и наборы точек, ориентированных на объекты (object-centric point sets) для формирования контекстного понимания текущей операции. Состояние робота включает в себя данные о положении суставов, скорости и ускорении, что позволяет модели учитывать кинематику и динамику движения. Векторные представления задачи кодируют цели и ограничения, определяющие желаемое поведение робота. Наборы точек, ориентированных на объекты, предоставляют информацию о расположении и форме объектов в окружающей среде, что необходимо для планирования действий и взаимодействия с миром. Комбинируя эти три источника данных, RC-NF способна генерировать вероятностные распределения, отражающие реалистичные и контекстно-зависимые траектории движения робота.

Сеть Robot-Conditioned Point Query (RCPQNet) используется в качестве аффинного связующего слоя в RC-NF для генерации параметров сдвига и масштаба.
Сеть Robot-Conditioned Point Query (RCPQNet) используется в качестве аффинного связующего слоя в RC-NF для генерации параметров сдвига и масштаба.

Детальная Экстракция Признаков с Помощью RC-PQNet

В основе RC-NF лежит сеть Robot-Conditioned Point Query Network (RC-PQNet), представляющая собой слой аффинного сопряжения, предназначенный для эффективного объединения разнородной мультимодальной информации. RC-PQNet использует механизм аффинного преобразования для моделирования зависимостей между различными входными модальностями, что позволяет сети создавать компактные и информативные представления объектов. Этот подход обеспечивает более точное и надежное извлечение признаков, необходимых для последующих этапов обработки, таких как планирование манипуляций и управление роботом. Слой аффинного сопряжения позволяет моделировать сложные взаимосвязи между входными данными, сохраняя при этом вычислительную эффективность.

Сеть RC-PQNet использует SAM2 (Segment Anything Model 2) для точного выделения масок объектов на изображении. Для захвата детальной информации о форме и положении объектов применяется Dual-Branch Point Feature Encoding — метод, который параллельно обрабатывает данные о точках, представляющих объект, в двух ветвях: одна ветвь фокусируется на геометрической форме, а другая — на позиционных координатах. Такой подход позволяет получить более полное и нюансированное представление об объекте, необходимое для последующего анализа и манипулирования.

Сеть RC-PQNet адаптирует процесс извлечения признаков к конкретной выполняемой манипуляции посредством использования встраиваний задач (task embeddings). Эти встраивания представляют собой векторные представления, кодирующие информацию о типе манипуляции, например, захват объекта, перемещение или сборка. Встраивания задач вводятся в слои аффинного сопряжения RC-PQNet, модулируя процесс извлечения признаков и позволяя сети выделять наиболее релевантные характеристики объекта и его окружения, необходимые для успешного выполнения текущей манипуляции. Это обеспечивает контекстную осведомленность и позволяет сети динамически настраивать свои параметры извлечения признаков в зависимости от поставленной задачи.

В реальных условиях развертывания предложенный подход <span class="katex-eq" data-katex-display="false">\pi_0\pi_{0} + RC-NF</span> демонстрирует устойчивость к двум последовательным событиям, выходящим за рамки обучающей выборки, в то время как модель <span class="katex-eq" data-katex-display="false">\pi_0\pi_{0}</span> испытывает затруднения, при этом моменты <span class="katex-eq" data-katex-display="false">t_{1a}</span> (перемещение шара), <span class="katex-eq" data-katex-display="false">t_{2a}</span> (шар за захватом) и <span class="katex-eq" data-katex-display="false">t_{3r}</span> (возврат управления VLA) служат ключевыми индикаторами.
В реальных условиях развертывания предложенный подход \pi_0\pi_{0} + RC-NF демонстрирует устойчивость к двум последовательным событиям, выходящим за рамки обучающей выборки, в то время как модель \pi_0\pi_{0} испытывает затруднения, при этом моменты t_{1a} (перемещение шара), t_{2a} (шар за захватом) и t_{3r} (возврат управления VLA) служат ключевыми индикаторами.

Валидация и Характеристика Аномалий

Для оценки эффективности разработанного подхода использовался датасет LIBERO-Anomaly-10, представляющий собой эталонный набор данных, включающий три часто встречающиеся аномалии в работе роботов: неполное закрытие захвата (Gripper Open), проскальзывание захвата (Gripper Slippage) и пространственное рассогласование (Spatial Misalignment). Этот датасет позволяет всесторонне протестировать способность системы к обнаружению и классификации различных типов нештатных ситуаций, возникающих в процессе выполнения роботизированных задач. Выбор LIBERO-Anomaly-10 обусловлен его репрезентативностью и широким признанием в сообществе исследователей робототехники, что обеспечивает объективную оценку полученных результатов и возможность их сравнения с другими существующими методами.

Исследование продемонстрировало высокую эффективность разработанного метода RC-NF в обнаружении трех распространенных аномалий в робототехнике: открытия захвата, проскальзывания захвата и пространственного расхождения. В ходе тестирования на бенчмарке LIBERO-Anomaly-10, RC-NF превзошел существующие базовые модели, показав приблизительно 8%-ное увеличение показателя AUC и 10%-ное увеличение среднего значения AP. Эти результаты свидетельствуют о значительном улучшении точности и надежности системы обнаружения аномалий, что открывает возможности для повышения безопасности и эффективности робототехнических систем в различных приложениях.

В случае обнаружения пространственного рассогласования, разработанная система позволяет автоматически инициировать процедуру «доведения до дома» (Homing Procedure), корректируя траекторию робота и предотвращая дальнейшие ошибки. Важно отметить, что время реакции системы на подобные аномалии составляет всего 100 миллисекунд при использовании потребительской графической карты Nvidia GeForce RTX 3090. Эта высокая скорость обработки позволяет оперативно реагировать на отклонения, обеспечивая стабильную и безопасную работу робота даже в сложных условиях и минимизируя риск возникновения серьезных сбоев в процессе выполнения задач.

Аномальный счетчик указывает на обнаружение отклонения в последовательности действий, когда шар перемещается и оказывается за захватом, после чего траектория корректируется процедурой возврата к исходной точке, в то время как модель VLA <span class="katex-eq" data-katex-display="false"> \pi_{0} </span> продолжает функционировать.
Аномальный счетчик указывает на обнаружение отклонения в последовательности действий, когда шар перемещается и оказывается за захватом, после чего траектория корректируется процедурой возврата к исходной точке, в то время как модель VLA \pi_{0} продолжает функционировать.

Исследование, представленное в данной работе, демонстрирует значительный прогресс в области обнаружения аномалий в манипуляциях роботами. Модель RC-NF, основанная на нормализующих потоках, позволяет не только выявлять отклонения от нормального поведения, но и адаптироваться к динамично меняющимся условиям. Как однажды заметил Эндрю Ын: «Мы должны стремиться к созданию систем, которые не просто реагируют на данные, а учатся понимать их лежащие в основе закономерности». Этот принцип находит отражение в RC-NF, которая, отслеживая выполнение задачи, способна строить более надежную и гибкую модель нормального поведения, что особенно важно для работы в реальном времени и в условиях неопределенности.

Куда двигаться дальше?

Представленная работа, безусловно, расширяет границы возможностей обнаружения аномалий в манипуляциях роботов. Однако, стоит признать, что сама концепция «нормальности» остается, как всегда, весьма условной. Модель RC-NF, как и любая другая, опирается на данные, и следовательно, подвержена влиянию предвзятостей и неполноты информации. Дальнейшие исследования должны быть направлены на разработку методов адаптации модели к новым, неожиданным сценариям, не ограничиваясь лишь наблюдением за текущим выполнением задачи. Необходимо исследовать способы интеграции априорных знаний о физическом мире и принципах причинно-следственных связей.

Особый интерес представляет вопрос о масштабируемости. Успешное функционирование модели в контролируемой среде — это лишь первый шаг. Реальные производственные условия характеризуются высокой степенью неопределенности и шума. Следует сосредоточиться на разработке робастных алгоритмов, устойчивых к различным помехам и способных к самообучению в динамически меняющейся обстановке. Нельзя забывать и о вычислительной эффективности — реальное время требует компромиссов.

В конечном итоге, задача состоит не в том, чтобы создать идеальную модель «нормального» поведения, а в том, чтобы разработать систему, способную к гибкому и адаптивному реагированию на любые отклонения, будь то ошибка или просто новая, неожиданная ситуация. В этом и заключается истинный вызов для исследователей в области робототехники и машинного обучения.


Оригинал статьи: https://arxiv.org/pdf/2603.11106.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-15 13:54