Иллюзии в 3D: Как обмануть нейросети, создающие реалистичные объекты

Автор: Денис Аветисян


Новое исследование показывает, что даже незначительные изменения в данных могут привести к серьезным искажениям в 3D-моделях, создаваемых на основе Gaussian Splatting.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал
Атака на модель 3DGS с использованием алгоритма PGD демонстрирует, что даже незначительные, незаметные возмущения входных данных способны существенно снизить качество реконструированных изображений, что подтверждается как количественным снижением метрики PSNR (нормированной до максимального значения 30), так и визуальными артефактами, полученными на наборе данных RE10K.
Атака на модель 3DGS с использованием алгоритма PGD демонстрирует, что даже незначительные, незаметные возмущения входных данных способны существенно снизить качество реконструированных изображений, что подтверждается как количественным снижением метрики PSNR (нормированной до максимального значения 30), так и визуальными артефактами, полученными на наборе данных RE10K.

Работа демонстрирует уязвимость feed-forward 3D Gaussian Splatting к black-box атакам и предлагает эффективный метод, основанный на анализе частотного спектра, для снижения качества реконструкции.

Несмотря на впечатляющие успехи в области трехмерной реконструкции, модели Gaussian Splatting, особенно feed-forward варианты, остаются уязвимыми к целенаправленным манипуляциям. В настоящей работе, ‘AdvSplat: Adversarial Attacks on Feed-Forward Gaussian Splatting Models’, впервые систематически исследуется возможность реализации adversarial атак на такие модели. Показано, что даже незначительные, незаметные возмущения входных изображений могут существенно ухудшить качество реконструкции, причем предложены эффективные алгоритмы black-box атак, использующие параметризацию в частотной области. Не является ли обеспечение надежности и устойчивости feed-forward Gaussian Splatting критически важным для их безопасного внедрения в практические приложения?


Хрупкость Трехмерной Реконструкции: Математическая Неустойчивость

Современные методы трехмерной реконструкции, впечатляющие своей визуальной реалистичностью, оказываются неожиданно чувствительны к незначительным изменениям входных данных. Даже минимальные возмущения, едва заметные для человеческого глаза, способны существенно исказить полученную трехмерную модель. Исследования показывают, что алгоритмы, полагающиеся на точную информацию о каждом пикселе, формируют хрупкое представление об объекте, которое легко нарушить. Данная уязвимость объясняется тем, что небольшие ошибки в исходных данных накапливаются и усиливаются в процессе реконструкции, приводя к заметным деформациям и неточностям. В результате, несмотря на впечатляющие результаты в лабораторных условиях, надежность этих методов в реальных сценариях, где входные данные часто зашумлены или неполны, вызывает серьезные опасения.

Современные методы трехмерной реконструкции, несмотря на впечатляющие визуальные результаты, оказываются уязвимыми из-за чрезмерной зависимости от точности на уровне отдельных пикселей. Это создает хрупкое представление, которое легко подвергается воздействию так называемых “атакующих” возмущений — небольших, намеренно внесенных изменений в исходные данные, способных кардинально исказить конечную трехмерную модель. По сути, даже незначительные отклонения в цветовых значениях или расположении пикселей могут привести к серьезным ошибкам в реконструкции, поскольку алгоритмы интерпретируют эти изменения как реальные изменения в геометрии сцены. Такая чувствительность делает существующие системы уязвимыми для злонамеренных атак и ограничивает их применение в критически важных областях, где надежность и устойчивость к внешним воздействиям являются первостепенными.

Хрупкость современных методов 3D-реконструкции существенно ограничивает их применение в областях, требующих высокой надежности и устойчивости. В частности, системы автономной навигации, такие как беспилотные автомобили и роботы, полагаются на точное восприятие окружающего мира, и даже незначительные искажения в 3D-модели могут привести к критическим ошибкам в принятии решений. Аналогичная проблема возникает и в приложениях дополненной реальности, где стабильное и точное наложение виртуальных объектов на реальное окружение является ключевым фактором удобства и реалистичности. Неспособность 3D-реконструкций справляться с незначительными возмущениями входных данных ставит под вопрос их пригодность для использования в критически важных сценариях, подчеркивая необходимость разработки более устойчивых и надежных алгоритмов.

Атака на системы RE10K и DL3DV с уровнем шума <span class="katex-eq" data-katex-display="false">\epsilon=8/255</span> демонстрирует искажения в реконструированных изображениях, что указывает на уязвимость систем к подобным воздействиям.
Атака на системы RE10K и DL3DV с уровнем шума \epsilon=8/255 демонстрирует искажения в реконструированных изображениях, что указывает на уязвимость систем к подобным воздействиям.

Понимание Поверхности Атаки: Природа Возмущения

Враждебные атаки, такие как PGD Attack, целенаправленно используют уязвимости в конвейерах 3D-реконструкции. Они не являются случайными помехами, а представляют собой систематическую эксплуатацию недостатков алгоритмов обработки данных. Атаки строятся на основе выявления и усиления незначительных изменений во входных данных, которые приводят к существенным искажениям в реконструированной 3D-модели. Это достигается за счет анализа и манипулирования данными на различных этапах конвейера, включая этапы сбора данных, предварительной обработки и финальной реконструкции. Эффективность атаки зависит от специфики конвейера и выбранного алгоритма, а также от степени оптимизации процесса создания возмущений.

Атаки на 3D-реконструкцию часто используют частотную область для выявления и усиления незначительных возмущений, невидимых для человеческого глаза. Этот подход основан на том, что даже минимальные изменения в частотном спектре исходных данных могут существенно повлиять на процесс реконструкции, приводя к появлению артефактов или искажений в конечном результате. Анализ в частотной области позволяет злоумышленнику эффективно определять наиболее чувствительные участки данных и целенаправленно вносить в них небольшие, но критические изменения, которые не обнаруживаются визуально, но приводят к значительным ошибкам в реконструированной модели. f(x) = \in t_{-\in fty}^{\in fty} F(\omega) e^{j\omega x} d\omega демонстрирует преобразование из пространственной области в частотную, где манипуляции с F(\omega) могут быть использованы для создания невидимых возмущений.

Для эффективной генерации возмущений, максимизирующих влияние на качество 3D-реконструкции, в adversarial атаках часто используются алгоритмы оптимизации, такие как CMA-ES (Covariance Matrix Adaptation Evolution Strategy) и NES (Natural Evolution Strategies). CMA-ES представляет собой эволюционный алгоритм, который адаптирует матрицу ковариации для эффективного поиска оптимальных решений в высокоразмерном пространстве параметров. NES, в свою очередь, использует градиентный подход, основанный на оценке изменений в целевой функции при небольших возмущениях, для быстрого определения направлений, приводящих к ухудшению качества реконструкции. Оба алгоритма позволяют автоматизировать процесс поиска оптимальных возмущений, значительно превосходя по эффективности ручной подбор и обеспечивая высокую степень воздействия на результаты 3D-реконструкции.

Набор оптимизированных состязательных примеров позволяет получить более качественные результаты при рендеринге новых видов в наборах данных RE10K и DL3DV, превосходя базовые методы, такие как DepthSplat (DP), NoPoSlat (NP) и AnySplat (AP) в градиентном (GB) и безградиентном (GF) вариантах.
Набор оптимизированных состязательных примеров позволяет получить более качественные результаты при рендеринге новых видов в наборах данных RE10K и DL3DV, превосходя базовые методы, такие как DepthSplat (DP), NoPoSlat (NP) и AnySplat (AP) в градиентном (GB) и безградиентном (GF) вариантах.

Feed-Forward 3DGS: Надежное Представление и Математическая Элегантность

Метод Feed-Forward 3DGS представляет собой сетевой подход к предсказанию параметров 3D-гауссиан, что принципиально снижает чувствительность к шуму на уровне пикселей. Вместо непосредственной реконструкции геометрии, сеть обучается прогнозировать параметры гауссиан, описывающих распределение плотности в сцене. Этот процесс, основанный на обучении нейронной сети, позволяет абстрагироваться от отдельных шумных пикселей, поскольку параметры гауссиан определяются на основе более глобального контекста изображения. В результате, даже при наличии значительного шума на уровне пикселей, предсказанные 3D-гауссианы остаются стабильными и позволяют получить более точное представление о сцене. Фактически, сеть учится выделять устойчивые признаки, не подверженные влиянию случайных вариаций яркости отдельных пикселей.

Использование абстрактного представления в Feed-Forward 3DGS снижает уязвимость к возмущениям, используемым в adversarial атаках. Традиционные методы 3D-реконструкции часто полагаются на точные значения пикселей, что делает их чувствительными к незначительным, но намеренно внесенным изменениям в изображение. Feed-Forward 3DGS, напротив, учится извлекать высокоуровневые признаки, которые менее подвержены влиянию локальных возмущений. Вместо того, чтобы напрямую реконструировать геометрию на основе пиксельных данных, сеть формирует более устойчивое представление сцены, что затрудняет создание возмущений, способных существенно исказить реконструируемую 3D-модель. Это достигается за счет обучения сети игнорировать незначительные изменения в входных данных, сосредотачиваясь на более существенных и общих характеристиках сцены.

В отличие от традиционных методов 3D-реконструкции, фокусирующихся на точной геометрической модели, Feed-Forward 3DGS смещает акцент на извлечение устойчивых признаков и понимание сцены. Этот подход позволяет сети изучать абстрактные представления, которые не зависят от детальной геометрии, что способствует более надежному анализу и интерпретации данных. Вместо простого восстановления формы, система концентрируется на идентификации и кодировании семантически значимых характеристик сцены, что улучшает общую робастность и способность к обобщению. Такой переход от геометрии к признакам позволяет более эффективно справляться с шумами, окклюзиями и другими помехами, а также обеспечивает более глубокое понимание содержимого сцены.

Предложенный метод включает в себя варианты, основанные на градиентах и не требующие их, для оптимизации параметров 3DGS модели путем итеративного добавления шума к коэффициентам DCT, рендеринга изображений и поиска оптимального возмущения, максимизирующего функцию потерь.
Предложенный метод включает в себя варианты, основанные на градиентах и не требующие их, для оптимизации параметров 3DGS модели путем итеративного добавления шума к коэффициентам DCT, рендеринга изображений и поиска оптимального возмущения, максимизирующего функцию потерь.

Валидация Устойчивости: Строгий Экспериментальный Анализ

Оценка производительности осуществлялась на наборах данных Re10K и DL3DV, что позволяет проводить сравнительный анализ с существующими методами в области 3D реконструкции. Набор данных Re10K включает в себя синтетические сцены с реалистичным освещением и текстурами, а DL3DV — это набор данных, содержащий реальные 3D-модели и соответствующие изображения. Использование этих стандартизированных наборов данных обеспечивает объективную оценку качества реконструкции и позволяет установить положение разработанного метода относительно других существующих подходов, облегчая сравнение и выявление сильных и слабых сторон.

Для количественной оценки качества реконструкции и перцептивной схожести используются метрики PSNR (Peak Signal-to-Noise Ratio), SSIM (Structural Similarity Index), LPIPS (Learned Perceptual Image Patch Similarity), DINO Similarity и CLIP Similarity. В ходе тестирования было установлено, что при воздействии атак (adversarial attacks) наблюдается значительное снижение значений всех указанных метрик. Снижение PSNR указывает на увеличение шума и искажений в реконструированном изображении, в то время как падение SSIM и LPIPS свидетельствует об ухудшении структурного и перцептивного сходства между оригинальным и реконструированным изображением. Уменьшение значений DINO Similarity и CLIP Similarity подтверждает снижение семантического соответствия между изображениями.

Результаты экспериментов показывают, что Feed-Forward 3DGS демонстрирует превосходную устойчивость к преднамеренным искажениям (adversarial attacks). Это подтверждается значительным улучшением показателей, характеризующих качество реконструкции и перцептивное сходство. В частности, при воздействии атак наблюдается снижение значений метрик PSNR, SSIM, LPIPS, DINO Similarity и CLIP Similarity, что свидетельствует о более высокой степени сохранения качества выходных данных по сравнению с другими методами. Уменьшение величин этих метрик указывает на более эффективное противодействие искажающим воздействиям и, следовательно, на повышенную надежность системы в условиях неблагоприятных входных данных.

На изображениях демонстрируется, как атаки различной интенсивности приводят к постепенному осветлению итогового изображения, что визуализируется на фоне серого цвета для большей наглядности.
На изображениях демонстрируется, как атаки различной интенсивности приводят к постепенному осветлению итогового изображения, что визуализируется на фоне серого цвета для большей наглядности.

Исследование уязвимости моделей 3D Gaussian Splatting к adversarial атакам подтверждает, что даже кажущаяся визуальная достоверность не гарантирует математическую корректность представления данных. Как отмечает Джеффри Хинтон: «Я думаю, что сейчас мы находимся в ситуации, когда люди слишком быстро пытаются строить сложные системы, не понимая, как они работают». Данная работа демонстрирует, что незначительные, едва заметные возмущения способны значительно ухудшить качество реконструкции, что подчеркивает необходимость строгого математического анализа и доказательства устойчивости алгоритмов. Анализ в частотной области, предложенный авторами, позволяет выявить слабые места в представлении данных и разработать более надежные методы защиты, основанные на математической дисциплине.

Куда Далее?

Представленная работа, выявив уязвимость моделей 3D Gaussian Splatting к состязательным атакам, лишь обнажила глубину проблемы. До сих пор, акцент в разработке подобных моделей делался на достижение фотореалистичности и скорости реконструкции, в то время как вопросы устойчивости к намеренным искажениям оставались в тени. Очевидно, что достижение визуальной правдоподобности само по себе не является достаточным критерием качества — необходимо доказывать корректность алгоритма, а не просто демонстрировать его работоспособность на ограниченном наборе данных.

Будущие исследования должны быть направлены не только на разработку методов защиты от атак, но и на фундаментальное понимание того, какие характеристики моделей делают их уязвимыми. Анализ в частотной области, представленный в данной работе, является перспективным направлением, однако требует дальнейшего развития. Важно исследовать, как различные параметры Gaussian Splatting влияют на устойчивость к искажениям, и разработать метрики, позволяющие оценивать надежность реконструкции, а не только ее визуальное качество.

Возможно, истинное решение кроется не в усложнении существующих моделей, а в переходе к принципиально новым подходам, основанным на математической строгости и доказуемой устойчивости. Иначе, мы обречены на бесконечную гонку вооружений, в которой каждая новая защита будет лишь провоцировать появление более изощренной атаки. Элегантность алгоритма, как и красота математической теоремы, заключается в его внутренней непротиворечивости, а не в способности обмануть наблюдателя.


Оригинал статьи: https://arxiv.org/pdf/2603.23686.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-27 05:27