Обучение представлений для выявления аномалий: новый подход

Автор: Денис Аветисян


Исследование предлагает инновационный метод предварительного обучения представлений для повышения точности обнаружения аномалий в промышленных данных.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Бесплатный Телеграм канал
Предварительное обучение представлений аномалий демонстрирует стабильное превосходство над исходными признаками в различных методах и архитектурах обнаружения аномалий на наборах данных MVTecAD и VisA, что указывает на эффективность предложенного подхода к выделению признаков.
Предварительное обучение представлений аномалий демонстрирует стабильное превосходство над исходными признаками в различных методах и архитектурах обнаружения аномалий на наборах данных MVTecAD и VisA, что указывает на эффективность предложенного подхода к выделению признаков.

В статье представлена методика ADPretrain, которая позволяет значительно улучшить качество выявления аномалий за счет обучения специализированных векторных представлений, адаптированных к особенностям данных.

Современные методы обнаружения аномалий часто полагаются на предварительно обученные сети, изначально разработанные для задач, отличных от выявления отклонений. В работе ‘ADPretrain: Advancing Industrial Anomaly Detection via Anomaly Representation Pretraining’ предложен новый подход к обучению представлений, специально ориентированный на задачи обнаружения аномалий в промышленной визуальной инспекции. Ключевым результатом является демонстрация значительного улучшения производительности по сравнению с использованием признаков, полученных из моделей, предварительно обученных на ImageNet, благодаря контрастирующим потерям, ориентированным на углы и нормы, и обучению на остаточных признаках. Возможно ли дальнейшее повышение эффективности обнаружения аномалий за счет разработки еще более специализированных методов обучения представлениям, учитывающих специфику различных промышленных сценариев?


За гранью традиционного: вызовы обнаружения аномалий

Традиционные методы обнаружения аномалий, такие как подходы, основанные на реконструкции, и DeepSVDD, часто сталкиваются с трудностями при работе со сложными распределениями данных и обобщением на новые данные. Это снижает их эффективность в реальных приложениях, где данные могут значительно отличаться от обучающих выборок. Методы могут быть чувствительны к шуму и не способны выявлять тонкие аномалии, что ограничивает их применимость. В связи с этим возрастает потребность в надежных и обобщающих методах обнаружения аномалий в различных промышленных областях. Подобно тому, как художник выявляет скрытые формы в хаосе красок, понимание закономерностей в данных открывает мир, если интерпретировать его через строгую логику и креативные гипотезы.

На основе остаточных признаков изучается представление аномалий, при этом остаточные признаки генерируются путем вычитания нормальных эталонных признаков, извлеченных из эталонных образцов, а оптимизация признаков, полученных проектором признаков, осуществляется с использованием контрастных потерь, ориентированных на угол и норму, при этом проектор признаков основан на архитектуре Transformer с измененным механизмом самовнимания.
На основе остаточных признаков изучается представление аномалий, при этом остаточные признаки генерируются путем вычитания нормальных эталонных признаков, извлеченных из эталонных образцов, а оптимизация признаков, полученных проектором признаков, осуществляется с использованием контрастных потерь, ориентированных на угол и норму, при этом проектор признаков основан на архитектуре Transformer с измененным механизмом самовнимания.

Контрастивное обучение: формирование устойчивых признаков

Контрастивное обучение представляет собой перспективный подход к формированию дискриминативных представлений признаков путем сопоставления схожих и различных примеров. Этот метод позволяет модели научиться выделять ключевые характеристики, отличающие нормальные данные от аномальных. Максимизируя расстояние между признаками нормальных и аномальных данных, создается пространство признаков, в котором аномалии легко идентифицируются. Самообучающееся обучение обеспечивает необходимые неразмеченные данные для предварительного обучения представлений, повышая производительность в условиях дефицита размеченных данных.

Карты оценки аномалий, генерируемые PatchCore с использованием CLIP-L в качестве основной сети, демонстрируют влияние предварительно обученных признаков на выявление аномалий.
Карты оценки аномалий, генерируемые PatchCore с использованием CLIP-L в качестве основной сети, демонстрируют влияние предварительно обученных признаков на выявление аномалий.

Предварительное обучение представлений аномалий: новый подход

Предварительное обучение представлений аномалий направлено на изучение специализированных представлений для задач обнаружения аномалий. В отличие от традиционных подходов, использующих предобученные модели для классификации изображений, данная методика фокусируется на извлечении признаков, оптимальных для выявления отклонений от нормы. Ключевым компонентом является Feature Projector с Learnable Key/Value Attention, преобразующий исходные признаки и усиливающий их дискриминационные способности. Особое внимание уделяется использованию Residual Features, захватывающих обобщающую информацию, независимую от конкретного класса. Экспериментальные результаты на MVTecAD, VisA и BTAD демонстрируют превосходство предлагаемого подхода над использованием признаков, предобученных на ImageNet.

Визуализация t-SNE признаков, полученных из класса
Визуализация t-SNE признаков, полученных из класса «capsules» набора данных VisA, показывает, что использование предварительно обученных признаков позволяет получить более четкое разделение данных.

Расширяя границы обнаружения аномалий

Предварительное обучение представлений аномалий эффективно расширяет возможности существующих методов обнаружения аномалий, таких как PatchCore, CFLOW и UniAD, значительно повышая их производительность и устойчивость. Разработанный метод превосходит традиционные подходы, включая GLASS и FeatureNorm, обеспечивая более точную локализацию аномалий. Количественная оценка на MVTec, VisA, BTAD, MVTec3D и MPDD подтверждает превосходство метода. Предложенная схема поддерживает обучение с малым количеством примеров, достигая конкурентоспособных результатов при 2-х и 4-х примерах на класс, сопоставимых или превосходящих KAG-Prompt, и сохраняя высокую производительность при добавлении 10% шума.

Визуализация t-SNE признаков, полученных из классов
Визуализация t-SNE признаков, полученных из классов «candle», «chewinggum», «pcb1» и «fryum» набора данных VisA, демонстрирует различия в представлении различных объектов.

Исследование, представленное в статье, подчеркивает важность разработки специализированных представлений признаков для задач обнаружения аномалий. Вместо использования универсальных моделей, обученных на больших, но нерелевантных наборах данных, авторы предлагают подход предварительного обучения, направленный на создание робастных представлений, адаптированных к особенностям аномалий. Как отмечает Фэй-Фэй Ли: “Искусственный интеллект должен быть сосредоточен на расширении возможностей человека, а не на его замене.” Эта цитата отражает суть работы: не создание автономной системы, а повышение эффективности обнаружения аномалий за счет целенаправленного обучения моделей, что особенно важно в промышленных приложениях, где точность и надежность имеют первостепенное значение. Предварительное обучение, описанное в статье, позволяет выявить тонкие различия в данных, которые могли бы остаться незамеченными при использовании стандартных подходов к извлечению признаков.

Что впереди?

Представленная работа, демонстрируя эффективность предварительного обучения представлений для обнаружения аномалий, неизбежно ставит вопрос о природе самой аномалии. Если закономерность нельзя воспроизвести или объяснить, её не существует – и это справедливо не только для физических явлений, но и для отклонений от нормы. Успех подхода ADPretrain указывает на то, что аномалии обладают внутренней структурой, которую можно уловить через целенаправленное обучение представлений. Однако, остаётся неясным, насколько универсальны эти представления. Будут ли они эффективны в различных индустриальных контекстах, с различными типами данных и аномалий?

Очевидным направлением для дальнейших исследований является расширение спектра данных для предварительного обучения. Вместо фокусировки исключительно на изображениях, целесообразно исследовать возможности использования мультимодальных данных, объединяющих визуальную информацию с данными датчиков, временными рядами и другими источниками. Это позволит создать более полные и устойчивые представления, способные обнаруживать сложные аномалии, проявляющиеся в различных модальностях.

Наконец, необходимо критически оценить метрики оценки, используемые в данной области. Часто используемые показатели могут быть чувствительны к шуму и не отражать реальную полезность обнаруженных аномалий. Разработка более надёжных и релевантных метрик, учитывающих экономический эффект от обнаружения аномалий, представляется важной задачей для будущего развития исследований в области промышленного обнаружения аномалий.


Оригинал статьи: https://arxiv.org/pdf/2511.05245.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-10 12:53