Поиск нового за пределами Стандартной модели: Искусственный интеллект на службе Большого адронного коллайдера

Автор: Денис Аветисян

Исследователи применяют методы, вдохновленные большими языковыми моделями, для поиска аномалий в данных, полученных на Большом адронном коллайдере, что открывает новые возможности для обнаружения новой физики.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

В ходе случайного события происходит маскировка токена с индексом 5 (идентификатор 397397), демонстрируя процедуру, направленную на целенаправленное искажение или сокрытие конкретного элемента в потоке данных.

В работе представлен метод неконтролируемого обнаружения аномалий, основанный на предсказании замаскированных токенов, использующий стратегии токенизации, такие как VQ-VAE, для эффективного представления событий на коллайдере.

Поиск новых физических явлений на Большом адронном коллайдере осложняется необходимостью выделения редких сигналов на фоне огромного потока стандартных событий. В работе ‘Masked-Token Prediction for Anomaly Detection at the Large Hadron Collider’ представлен инновационный подход, использующий методы, вдохновленные большими языковыми моделями, а именно предсказание замаскированных токенов, для поиска аномалий без предварительных знаний о природе новых частиц. Показано, что обучение представлениями событий, основанными на глубокой токенизации с использованием векторных квантователей (VQ-VAE), значительно повышает чувствительность к отклонениям от стандартной модели. Способен ли этот подход обеспечить масштабируемое и независимое от модели обнаружение новой физики, снижая вычислительные затраты и открывая новые горизонты в анализе данных коллайдеров?

За гранью Стандартной модели: В поисках новой физики

Современная Стандартная модель физики элементарных частиц, несмотря на свой впечатляющий успех в описании фундаментальных взаимодействий, оставляет без ответа ряд ключевых вопросов. Наблюдаемая масса нейтрино, существование тёмной материи и тёмной энергии, а также асимметрия между материей и антиматерией во Вселенной — всё это указывает на необходимость расширения существующей теоретической базы. Эти необъяснимые явления стимулируют активные поиски «физики за пределами Стандартной модели», направленные на обнаружение новых частиц и взаимодействий, которые могли бы разрешить эти загадки и предложить более полное понимание природы реальности. Исследования в этой области охватывают как теоретическое моделирование, так и экспериментальные поиски на коллайдерах и в глубокоподземных лабораториях, стремясь раскрыть скрытые аспекты фундаментального мира.

Для выявления редких проявлений новой физики, выходящей за рамки Стандартной модели, необходимы надежные методы обнаружения аномалий, способные различать незначительные отклонения от ожидаемого фона. Эти методы сталкиваются с серьезными трудностями при анализе данных, получаемых на коллайдерах, где огромный поток частиц создает сложный и зашумленный ландшафт. Успешное обнаружение новых частиц или взаимодействий требует разработки алгоритмов, способных эффективно отфильтровывать преобладающий фон и выделять слабые сигналы, которые могут указывать на существование неизвестных явлений. Развитие таких техник является ключевым направлением современных исследований в области физики высоких энергий, открывающим возможности для расширения нашего понимания фундаментальных законов природы и поиска ответов на нерешенные вопросы.

Традиционные методы поиска аномалий в данных, полученных на коллайдерах, сталкиваются с серьезными трудностями из-за чрезвычайной сложности этих данных. Огромные объемы информации, включающие в себя множество стандартных процессов и фонового шума, затрудняют выделение слабых сигналов, указывающих на существование новых частиц или явлений, выходящих за рамки Стандартной модели. Существующие алгоритмы часто не обладают достаточной чувствительностью для обнаружения этих отклонений, особенно если новые частицы взаимодействуют слабо или имеют короткое время жизни. Это требует разработки более совершенных методов анализа, способных эффективно отфильтровывать шум и выявлять даже самые незначительные отклонения от теоретических предсказаний, что является ключевой задачей современной физики высоких энергий.

Распределения оценок аномалий для фоновых (синий) и сигнальных (зеленый) событий в эталонном наборе данных <span class="katex-eq" data-katex-display="false">t\bar{t}</span>, полученные из последующей модели, позволяют определить оптимальный порог дискриминации (красный). — Распределения оценок аномалий для фоновых (синий) и сигнальных (зеленый) событий в эталонном наборе данных $t\bar{t}$ , полученные из последующей модели, позволяют определить оптимальный порог дискриминации (красный).

Представление событий: Токенизация данных коллайдера

Данные, получаемые в результате столкновений частиц в коллайдерах, изначально представлены в виде непрерывных величин. Для применения методов обработки естественного языка (NLP) к этим данным, производится их дискретизация — преобразование в последовательность дискретных токенов, аналогичных словам в предложении. Каждый токен представляет собой квантованное значение одной или нескольких физических характеристик события столкновения, что позволяет представить сложные топологии событий в дискретном, структурированном формате, пригодном для анализа с использованием рекуррентных нейронных сетей и трансформеров, широко применяемых в NLP.

Для токенизации данных, полученных в результате столкновений частиц, используются два подхода. Первый — детерминированный метод, основанный на таблице поиска (Look-Up Table), где каждому диапазону значений физических величин соответствует определенный токен. Второй подход использует векторный квантованный вариационный автоэнкодер (VQ-VAE) для обучения представления данных. VQ-VAE позволяет автоматически выявлять и кодировать наиболее значимые характеристики событий столкновений в дискретные токены, формируя представление, оптимизированное для последующего анализа моделями, работающими с последовательностями данных.

Токенизация данных столкновений позволяет представить сложные топологии событий в формате, пригодном для последовательных моделей. Преобразование непрерывных параметров событий в дискретные токены создает последовательность, аналогичную предложению в языке, что позволяет использовать архитектуры, такие как рекуррентные нейронные сети (RNN) или трансформеры, для анализа и классификации событий. Каждый токен кодирует определенную характеристику события, а последовательность токенов представляет собой полное описание его топологии. Такой подход позволяет моделям улавливать зависимости между различными частями события и эффективно обрабатывать большие объемы данных, генерируемые в экспериментах на коллайдерах.

Анализ распределения индексов токенов, полученных с помощью VQ-VAE, для событий сигнала и фона при размерах словаря 512, 850 и 1700 показывает различия в распределениях, которые подчеркиваются в нижней панели разницей между нормализованными частотами встречаемости токенов сигнала и фона.

Детектор аномалий на основе трансформера

Для анализа последовательностей токенов событий используется архитектура Transformer, зарекомендовавшая себя как эффективный инструмент для обработки последовательных данных. Transformer состоит из механизма самовнимания (Self-Attention) и слоев прямой связи, что позволяет модели параллельно обрабатывать всю входную последовательность, в отличие от рекуррентных нейронных сетей. Это обеспечивает более высокую скорость обучения и возможность улавливать зависимости между удаленными элементами последовательности. Применение Transformer позволяет эффективно моделировать контекст каждого токена события, что критически важно для выявления аномалий, проявляющихся в отклонениях от ожидаемого поведения в последовательности.

Модель обучается с использованием техники маскированного предсказания токенов, аналогичной применяемой в больших языковых моделях. В процессе обучения случайные токены последовательности событий маскируются, и модель предсказывает их значения, основываясь на контексте оставшихся токенов. Этот подход позволяет модели изучить вероятностное распределение нормальных, фоновых событий, эффективно моделируя их статистические характеристики. Обучение происходит на большом наборе данных нормальных событий, что позволяет модели сформировать надежное представление о типичном поведении системы и, впоследствии, выявлять отклонения от него.

Механизм самовнимания (Self-Attention) внутри архитектуры Transformer позволяет модели улавливать долгосрочные зависимости между признаками событий. В отличие от рекуррентных нейронных сетей, которые обрабатывают последовательности последовательно, механизм самовнимания позволяет модели одновременно учитывать все признаки в последовательности при вычислении представлений каждого признака. Это достигается путем вычисления весов внимания, определяющих степень влияния каждого признака на остальные. Высокие веса внимания указывают на сильную взаимосвязь между признаками, что позволяет модели выявлять аномалии, связанные с необычными комбинациями признаков, даже если эти признаки находятся далеко друг от друга в последовательности событий. Таким образом, способность модели учитывать контекст всей последовательности значительно повышает точность обнаружения аномалий.

Анализ распределений индексов токенов для событий сигнала и фона при использовании схемы токенизации LUT с размерами словаря 456, 885 и 1524 показывает различия в распределениях, особенно в области, соответствующей <span class="katex-eq" data-katex-display="false">E_{T}^{miss}</span> и <span class="katex-eq" data-katex-display="false">\phi_{E_{T}^{miss}}</span>, что указывает на потенциальную возможность разделения сигнала и фона по этим признакам. — Анализ распределений индексов токенов для событий сигнала и фона при использовании схемы токенизации LUT с размерами словаря 456, 885 и 1524 показывает различия в распределениях, особенно в области, соответствующей $E_{T}^{miss}$ и $\phi_{E_{T}^{miss}}$ , что указывает на потенциальную возможность разделения сигнала и фона по этим признакам.

Валидация и эффективность: Превосходя существующие методы

Для оценки эффективности обнаружения аномалий использовалась метрика ROC AUC, позволяющая количественно оценить способность алгоритма различать сигналы, выходящие за рамки Стандартной модели, от фоновых процессов. Исследование охватывало как сложные процессы Стандартной модели, например, события с четырьмя топ-кварками, так и гипотетические сигналы, предсказываемые моделями, выходящими за рамки Стандартной модели, в частности, производство пар глюино-глюино в рамках SUSY. Такой подход позволил всесторонне проверить алгоритм в различных сценариях и продемонстрировать его способность выявлять новые физические явления, не предсказанные существующими теориями.

Предложенный подход продемонстрировал превосходство над общепринятыми методами неконтролируемого обнаружения аномалий, такими как DeepSVDD и DROCC. В ходе сравнительного анализа, новая методика позволила достичь более высокой точности в выявлении отклонений от нормы, что подтверждается результатами, полученными на сложных задачах, включающих моделирование процессов, происходящих в Стандартной модели физики элементарных частиц, и поиск признаков Новой физики. Это свидетельствует о потенциале данного подхода для повышения эффективности анализа данных в экспериментах, направленных на изучение фундаментальных законов природы и обнаружение явлений, выходящих за рамки существующей теоретической базы.

Результаты оценки эффективности подхода демонстрируют значительные показатели в обнаружении аномалий. В частности, достигнутое значение площади под ROC-кривой (AUC) составило 0.683 для бенчмарка, представляющего события с четырьмя топ-кварками, и впечатляющие 0.918 для бенчмарка, моделирующего производство пар глюино в рамках моделей, выходящих за рамки Стандартной модели. Эти значения свидетельствуют о конкурентоспособности предложенного метода по сравнению с существующими подходами к обнаружению аномалий, подтверждая его потенциал для применения в сложных задачах анализа данных в физике высоких энергий.

Распределения аномальных оценок для фоновых (синий) и сигнальных (оранжевый) событий в эталонном сценарии SUSY <span class="katex-eq" data-katex-display="false">\tilde{g}\tilde{g}</span>, полученные из downstream-модели, позволяют определить оптимальный порог дискриминации (красный). — Распределения аномальных оценок для фоновых (синий) и сигнальных (оранжевый) событий в эталонном сценарии SUSY $\tilde{g}\tilde{g}$ , полученные из downstream-модели, позволяют определить оптимальный порог дискриминации (красный).

Исследование, представленное в статье, демонстрирует, что подход к анализу данных, вдохновлённый большими языковыми моделями, позволяет выявлять аномалии в данных, полученных на Большом адронном коллайдере. Авторы используют метод предсказания замаскированных токенов, что, по сути, является попыткой реконструировать недостающие части информации. Это напоминает подход к пониманию любой сложной системы — не просто наблюдать за ней, а пытаться предсказать её поведение. Как однажды заметил Ричард Фейнман: «Если вы не можете объяснить что-то простыми словами, значит, вы сами этого не понимаете». И в данном случае, способность модели предсказывать замаскированные токены — это показатель её глубокого понимания структуры данных коллайдера, а значит, и потенциальной чувствительности к новым физическим явлениям. Каждый новый патч в алгоритме — это философское признание несовершенства нашего понимания.

Что дальше?

Представленная работа, по сути, лишь аккуратный взлом системы. Преобразование данных столкновений в последовательности токенов, а затем применение логики, заимствованной из обработки естественного языка — элегантный обход традиционных методов поиска новой физики. Однако, стоит признать: успех этой стратегии напрямую зависит от качества самого токенизатора. VQ-VAE, при всей своей эффективности, — лишь один из возможных инструментов. Поиск более адаптивных и самообучающихся схем представления данных представляется не просто желательным усовершенствованием, а необходимой стадией эволюции.

Не стоит забывать и о фундаментальном ограничении: модель обучается на известных данных. Обнаружение действительно новой физики потребует не только чувствительности к отклонениям, но и способности экстраполировать за пределы известного. Следовательно, будущие исследования должны быть направлены на разработку методов, позволяющих модели «сомневаться» в своей собственной уверенности, активно искать области неопределенности и предлагать альтернативные интерпретации данных.

В конечном счете, представленный подход можно рассматривать как приглашение к эксперименту. Вместо того чтобы слепо следовать установленным правилам, необходимо подвергать их сомнению, искать лазейки и находить неожиданные решения. Ведь именно в этих поисках и кроется истинный прогресс. И, возможно, ключ к пониманию того, что скрывается за пределами известного.

Оригинал статьи: https://arxiv.org/pdf/2604.21035.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-24 15:00