Маскировка под угрозой: как вредоносное ПО обманывает системы обнаружения

Автор: Денис Аветисян

Новое исследование показывает, как злоумышленники могут создавать образцы вредоносного ПО, избегающие обнаружения и одновременно остающиеся незамеченными системами мониторинга изменений в данных.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал

В статье рассматриваются методы генерации атак на основе ограничений схожести для обхода систем обнаружения вредоносного ПО, адаптирующихся к изменениям данных.

Несмотря на впечатляющую точность алгоритмов глубокого обучения в обнаружении вредоносного ПО, их устойчивость в динамично меняющейся среде остается под вопросом. В работе, посвященной теме ‘Adversarial Evasion in Non-Stationary Malware Detection: Minimizing Drift Signals through Similarity-Constrained Perturbations’, исследуется возможность создания атак, обходящих не только классификаторы, но и системы мониторинга дрейфа данных. Показано, что использование ограничений, сохраняющих сходство с исходными образцами вредоносного ПО, позволяет снизить сигналы дрейфа, хотя и не всегда улучшает эффективность обхода обнаружения. Каким образом можно оптимально сбалансировать необходимость обхода обнаружения и минимизации сигналов дрейфа в условиях непрерывной эволюции угроз?

Неумолимая Эволюция Угроз и Вызовы Обнаружения

Традиционные методы обнаружения вредоносного программного обеспечения, основанные на сигнатурах, демонстрируют все меньшую эффективность в условиях распространения полиморфных и метаморфических угроз. Эти типы вредоносных программ способны изменять свой код, сохраняя при этом функциональность, что позволяет им обходить системы, полагающиеся на статические сигнатуры. Полиморфизм достигается за счет использования различных методов шифрования и обфускации, в то время как метаморфизм предполагает полную перестройку кода при каждой новой итерации. В результате, сигнатурные базы данных устаревают практически мгновенно, делая этот подход все менее надежным для защиты от современных киберугроз. Необходимость перехода к более адаптивным и интеллектуальным системам обнаружения становится очевидной, поскольку традиционные методы больше не способны обеспечить достаточный уровень безопасности.

Современные вредоносные программы демонстрируют всё более изощренные методы обхода систем защиты, что делает традиционные сигнатурные подходы неэффективными. Разработчики вредоносного ПО активно используют полиморфизм, метаморфизм, обфускацию кода и другие техники, позволяющие маскировать свой код и избегать обнаружения антивирусными программами. В связи с этим, всё большее значение приобретают методы машинного обучения, способные выявлять вредоносное поведение на основе анализа характеристик кода и сетевой активности, а не только по известным сигнатурам. Эти алгоритмы позволяют обнаруживать новые, ранее неизвестные угрозы, адаптируясь к постоянно меняющемуся ландшафту киберугроз и обеспечивая более надежную защиту информационных систем.

Эффективная классификация вредоносного программного обеспечения напрямую зависит от качества разработки признаков и способности представить его в осмысленном признаковом пространстве. Разработка признаков — это процесс извлечения наиболее релевантных характеристик из образцов вредоносного кода, которые позволяют отличить один тип вредоносного ПО от другого. Однако, простое извлечение признаков недостаточно; необходимо создать признаковое пространство, в котором эти признаки эффективно отражают взаимосвязи между различными образцами. Неудачно спроектированное признаковое пространство может привести к тому, что различные типы вредоносного ПО будут выглядеть похожими, а похожие — разными, значительно снижая точность классификации. Поэтому, оптимизация признакового пространства и выбор наиболее информативных признаков являются ключевыми задачами в разработке систем обнаружения вредоносного ПО, способных эффективно противостоять постоянно эволюционирующим угрозам.

Состязательные Атаки и Пределы Глубокого Обучения

Генерация состязательных вредоносных программ представляет собой серьезную угрозу для систем классификации, основанных на глубоком обучении, путем создания злонамеренных образцов, разработанных для обхода механизмов обнаружения. Эти образцы, часто создаваемые путем внесения небольших, намеренных изменений в легитимные файлы, эксплуатируют уязвимости в алгоритмах глубокого обучения. В отличие от традиционных методов обхода, состязательные атаки не полагаются на изменение сигнатур вредоносных программ, а манипулируют входными данными таким образом, чтобы модель ошибочно классифицировала вредоносный код как безопасный. Это достигается за счет использования градиентов модели для определения направлений, в которых небольшие изменения входных данных максимизируют вероятность неправильной классификации, что делает обнаружение с использованием традиционных сигнатурных методов неэффективным.

Градиентные атаки на системы машинного обучения используют собственные градиенты модели, вычисленные на основе функции потерь, такой как перекрестная энтропия (Cross-Entropy Loss), для создания незаметных, но эффективных возмущений входных данных. Эти возмущения, хотя и незначительные для человеческого глаза, целенаправленно изменяют входные данные таким образом, чтобы максимизировать функцию потерь и, следовательно, заставить модель классифицировать образец неверно. Процесс включает в себя вычисление градиента функции потерь по отношению к входным данным и внесение небольших изменений в направлении этого градиента, что позволяет злоумышленнику «обмануть» модель, не вызывая явных подозрений.

Применение регуляризации, в частности ℓ2-регуляризации, позволяет частично снизить эффективность атак, направленных на обход систем классификации, основанных на глубоком обучении. Наши результаты демонстрируют, что использование ℓ2-регуляризации обеспечивает сохранение вероятности успешной атаки (Attack Success Rate, ASR) на уровне приблизительно 3%. Одновременно с этим наблюдается существенное снижение сдвига распределения данных, которое измеряется с помощью Population Stability Index (PSI). Значение PSI снижается с исходного уровня 0.0025 (baseline) до 0.0008, что свидетельствует об улучшении устойчивости модели к небольшим изменениям входных данных, используемым при генерации атак.

Адаптация к Дрейфу Концепций для Долгосрочной Устойчивости

Эволюция характеристик вредоносного ПО, известная как дрейф концепций (Concept Drift), представляет собой серьезную проблему для статических моделей обнаружения. Со временем, злоумышленники адаптируют свои техники, изменяя сигнатуры, структуру и поведение вредоносных программ. Это приводит к постепенному снижению точности статических моделей, поскольку они становятся менее эффективными в идентификации новых, мутировавших образцов. В результате, модели, ранее демонстрировавшие высокую эффективность, со временем теряют свою актуальность и требуют регулярного обновления или адаптации для поддержания приемлемого уровня защиты.

Мониторинг концептуального дрифта является критически важным для поддержания высокой эффективности обнаружения вредоносного ПО, поскольку характеристики угроз постоянно эволюционируют. Для этого требуется применение методов оценки распределения входящих образцов, позволяющих выявлять изменения в данных. Отслеживание сдвигов в распределении позволяет оперативно реагировать на новые типы атак и предотвращать снижение точности статических моделей. Регулярная оценка распределения входящих данных, например, посредством статистических тестов или метрик, таких как расстояние Вассерштейна, позволяет своевременно определить необходимость обновления моделей и поддержания их актуальности.

Для выявления изменений в характеристиках вредоносного ПО, вызывающих снижение эффективности статических моделей, используется метрика Вассерштейна для сравнения распределений вероятностей. Экспериментальные данные показали, что применение ℓ2 регуляризации снижает статистику Колмогорова-Смирнова (KS) с 0.0183 (базовое значение) до 0.0121, что указывает на уменьшение сдвига в распределении. В отличие от этого, использование MMD регуляризации с линейным ядром привело к увеличению статистики KS до 0.0865, подтверждая преимущества использования ℓ2 регуляризации для более точного обнаружения сдвигов в характеристиках вредоносных программ и своевременного обновления моделей.

Исследование, представленное в данной работе, подчеркивает сложный баланс между уклонением от обнаружения и поддержанием маскировки перед системами мониторинга дрифта. Авторы демонстрируют, что накладываемые ограничения на сходство вредоносных программ могут снизить сигналы дрифта, однако не гарантируют более эффективного уклонения. Как точно подметила Грейс Хоппер: «Лучший способ предсказать будущее — это создать его». Это высказывание отражает суть подхода, представленного в статье: вместо пассивного ожидания эволюции вредоносных программ, необходимо активно формировать их характеристики, чтобы оценить устойчивость систем обнаружения к намеренным изменениям и определить доминирующие факторы, такие как бюджет возмущений, влияющие на эффективность как уклонения, так и маскировки.

Куда двигаться дальше?

Представленная работа, хотя и демонстрирует возможность манипулирования сигналами дрейфа в системах обнаружения вредоносного ПО, лишь подчёркивает фундаментальную сложность задачи. Оказалось, что наложить ограничения на сходство между исходным и модифицированным образцом недостаточно для одновременного обхода детекторов и сокрытия от систем мониторинга дрейфа. Это не удивительно; элегантное решение не обязательно короткое, оно непротиворечивое и логически завершённое. Ограничения, накладываемые на пространство признаков, неизбежно приводят к компромиссам, и бюджет возмущения остаётся доминирующим фактором.

В будущем необходимо отойти от упрощённых моделей атак и рассмотреть более сложные сценарии, учитывающие адаптацию детекторов к изменениям в потоке данных. Изучение влияния различных метрик сходства и разработка алгоритмов, способных динамически оптимизировать бюджет возмущения в зависимости от характеристик целевой системы, представляются перспективными направлениями. Необходимо также исследовать возможности использования методов формальной верификации для доказательства устойчивости детекторов к атакам, а не полагаться исключительно на эмпирические тесты.

В конечном счёте, задача обеспечения безопасности систем машинного обучения сводится к постоянной борьбе с противником, стремящимся найти уязвимости в логике работы системы. Простое увеличение сложности алгоритмов не является решением; истинная элегантность заключается в математической чистоте и доказуемости алгоритмов, а не в их способности «работать на тестах».

Оригинал статьи: https://arxiv.org/pdf/2604.21310.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-24 18:26