Машинное обучение на службе физики высоких энергий

Автор: Денис Аветисян

Новый подход к глобальному анализу данных позволяет эффективнее искать следы новых частиц и явлений.

Применение алгоритмов машинного обучения, в частности XGBoost, для ускорения статистического анализа в экспериментах Belle II, направленных на поиск аномалии в распаде B-мезонов.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

Выполнение глобальных статистических подгонок в физике высоких энергий часто сталкивается с вычислительными ограничениями, обусловленными сложностью теоретических моделей. В работе ‘Lecture notes on Machine Learning applications for global fits’ представлен комплексный подход, использующий алгоритмы машинного обучения, в частности, XGBoost, для аппроксимации функции правдоподобия и эффективного исследования пространства параметров. Показано, что разработанный рабочий процесс, включающий активное обучение и методы интерпретации, такие как SHAP-значения, позволяет успешно анализировать аномалию в распаде $B^\pm \to K^\pm \nu\bar{\nu}$ в эксперименте Belle II и накладывать ограничения на параметры аксион-подобных частиц. Каковы перспективы дальнейшего развития подобных методов для решения задач анализа данных в физике элементарных частиц и за ее пределами?

Раскрывая аномалии: В поисках новой физики за пределами Стандартной модели

Несмотря на впечатляющие успехи, Стандартная модель физики элементарных частиц не способна объяснить все наблюдаемые явления во Вселенной. Существующие теоретические рамки, описывающие известные частицы и взаимодействия, сталкиваются с трудностями при объяснении таких загадок, как темная материя, темная энергия и нейтринные осцилляции. Это несоответствие между теорией и экспериментом побуждает ученых к активному поиску “новой физики” — гипотетических частиц и взаимодействий, выходящих за пределы Стандартной модели. Исследования направлены на обнаружение отклонений от предсказанных теоретических значений в различных экспериментах, что может указать на существование ранее неизвестных фундаментальных сил и строительных блоков материи. Такой подход открывает перспективы для углубленного понимания устройства мироздания и расширения границ человеческих знаний.

Эксперимент Belle II находится на передовом крае поисков новой физики, тщательно анализируя распад частиц с целью выявления отклонений от теоретических предсказаний. В ходе детального изучения распадов B-мезонов на каоны и нейтрино (B^± → K^±ν̄ν) было зафиксировано статистически значимое отклонение от ожидаемых параметров. Этот процесс, включающий исчезновение нейтрино, особенно чувствителен к вкладу новых частиц и взаимодействий, не предусмотренных Стандартной моделью. Тщательное изучение характеристик этого распада, включая скорости и угловые распределения продуктов, позволяет ученым сузить область поиска этих гипотетических частиц и проверить границы существующей физической теории.

В ходе анализа распадов B-мезонов на каоны и нейтрино (B → Kνν) экспериментами, включая Belle II, зафиксировано отклонение от предсказаний Стандартной модели. Данное несоответствие, достигшее статистической значимости в 2.7 сигмы, представляет собой интригующий сигнал, указывающий на возможность существования новых, пока не открытых частиц или взаимодействий. Хотя для подтверждения необходимы дополнительные данные и статистический анализ, такие аномалии служат важным ориентиром в поисках физики за пределами известных границ, заставляя пересматривать существующие теоретические модели и направляя дальнейшие исследования в области физики элементарных частиц. Отклонение в скорости распада B-мезонов может указывать на влияние лептонов, не входящих в рамки Стандартной модели, или же на новые взаимодействия между кварками и нейтрино.

Теоретические горизонты: Расширяя Стандартную модель аксион-подобными частицами

Стандартная модель эффективной теории поля (СМЭТП) представляет собой методологию, позволяющую систематически включать эффекты новой физики в рамках установленной Стандартной модели. Вместо непосредственного введения новых частиц и взаимодействий, СМЭТП оперирует эффективными операторами, добавляемыми к лагранжиану Стандартной модели. Эти операторы, имеющие размерность, подавляются некоторой высокой шкалой энергии Λ, что позволяет параметризовать эффекты новой физики в терминах небольшого числа коэффициентов. Анализ СМЭТП позволяет исследовать различные сценарии новой физики и накладывать ограничения на соответствующие параметры, используя экспериментальные данные, не прибегая к конкретным моделям, и предоставляя модель-независимый подход к поиску отклонений от Стандартной модели.

Аксион-подобные частицы (АПЧ) рассматриваются как вероятные кандидаты для объяснения аномалии в распаде $B \rightarrow K\nu\nu$ . Данная аномалия представляет собой отклонение от предсказаний Стандартной Модели в частоте этого распада. Взаимодействие АПЧ с известными частицами, в частности с бозонами и фермионами, может приводить к изменению амплитуды распада $B \rightarrow K\nu\nu$ , что позволяет объяснить наблюдаемое расхождение с теоретическими предсказаниями. Предполагается, что АПЧ могут взаимодействовать с частицами через производные операторы, подавленные масштабом их массы, что делает их эффекты наблюдаемыми в процессах, чувствительных к новым источникам нарушения CP-инвариантности и отклонениям от Стандартной Модели.

Поведение аксион-подобных частиц (ALPs) необходимо рассматривать с учетом их зависимости от энергетического масштаба, что моделируется с помощью уравнений перенормировочной группы (RGE). Вычисление эволюции параметров ALPs в зависимости от энергии требует значительных вычислительных ресурсов, особенно при исследовании многомерного пространства параметров. Применение методов машинного обучения, в частности, нейронных сетей, позволяет существенно сократить время вычислений, необходимое для изучения пространства параметров RGE и определения феноменологически жизнеспособных областей для ALPs, обеспечивая более эффективный анализ потенциальных сигналов в экспериментах.

Ускоряя поиск: Машинное обучение для глобальной подгонки

Традиционные методы глобальной подгонки (Global Fit), несмотря на свою эффективность, требуют значительных вычислительных ресурсов при работе со сложными моделями и большими объемами данных. Вычислительная сложность возрастает экспоненциально с увеличением числа параметров модели и количества точек данных, необходимых для достижения необходимой точности. Это связано с тем, что традиционные методы часто включают в себя численное интегрирование дифференциальных уравнений перенормировочной группы (РГУ) для каждого набора параметров, что является ресурсоемкой задачей. Поиск оптимальных параметров требует многократного повторения этих вычислений для различных точек в многомерном пространстве параметров, что делает полный перебор непрактичным для задач, включающих большое количество параметров или требующих высокой точности.

Методы машинного обучения (ML) предоставляют эффективные инструменты для аппроксимации функции правдоподобия, что значительно ускоряет процесс оценки параметров в задачах глобальной подгонки. Традиционные методы, основанные на полном численном интегрировании уравнений перенормировочной группы (РГУ), требуют значительных вычислительных ресурсов. Использование ML позволяет получить приближенное значение функции правдоподобия за существенно меньшее время, демонстрируя значительное увеличение скорости оценки правдоподобия по сравнению с традиционными подходами. Это особенно актуально при работе со сложными моделями и большими объемами данных, где вычислительные затраты могут стать критическим фактором.

Двухэтапная модель машинного обучения, использующая алгоритм XGBoost для регрессии, позволяет эффективно отображать пространство параметров и вычислять функцию правдоподобия. XGBoost, являясь градиентным бустингом над решающими деревьями, обеспечивает высокую точность и скорость обучения. На первом этапе модель обучается на наборе данных, полученном из численных вычислений, для аппроксимации связи между параметрами модели и функцией правдоподобия. На втором этапе обученная модель используется для быстрой оценки функции правдоподобия для различных точек в пространстве параметров, значительно ускоряя процесс поиска оптимальных значений параметров по сравнению с прямым численным интегрированием уравнений перенормировки $RGE$ . Это позволяет проводить анализ сложных моделей и больших наборов данных за приемлемое время.

Активное обучение, в сочетании с Гауссовскими процессами (GP), представляет собой метод интеллектуального выбора точек данных для оценки в процессе глобальной подгонки. Вместо случайной выборки или полного перебора пространства параметров, GP используются для построения вероятностной модели функции правдоподобия. Это позволяет оценить, какие точки данных принесут наибольший информационный прирост, и, следовательно, наиболее эффективно уменьшат неопределенность в оценке параметров. Алгоритм активного обучения итеративно выбирает наиболее информативные точки для вычисления функции правдоподобия, минимизируя общее количество необходимых вычислений и, как следствие, значительно сокращая вычислительные затраты по сравнению с традиционными методами. $GP$ предоставляет оценку неопределенности, что критически важно для эффективного выбора точек данных.

Интерпретируя результаты: Раскрывая важность параметров с помощью SHAP значений

Методы, основанные на машинном обучении, всё шире применяются в физике высоких энергий, однако интерпретация результатов, полученных с их помощью, часто представляет собой сложную задачу. Значения SHAP (SHapley Additive exPlanations) представляют собой мощный инструмент для решения этой проблемы, позволяя количественно оценить вклад каждого параметра в итоговый прогноз модели. В отличие от традиционных подходов, SHAP Values используют концепцию из теории игр для справедливого распределения “вклада” каждого признака, обеспечивая надёжную и интерпретируемую оценку важности параметров. Этот подход позволяет не только понять, какие факторы оказывают наибольшее влияние на результат, но и выявить потенциальные нелинейные взаимодействия между параметрами, что особенно важно при анализе сложных физических процессов. Благодаря SHAP Values, исследователи могут уверенно использовать модели машинного обучения для поиска новых физических явлений и проверки существующих теорий.

Анализ значений SHAP позволяет физикам выявить наиболее значимые параметры, определяющие аномалию в распаде $B \rightarrow K\nu\nu$ . Этот метод, основанный на теории игр, количественно оценивает вклад каждого параметра в предсказание модели, что особенно важно при изучении сложных физических явлений. Выявляя параметры, оказывающие наибольшее влияние на наблюдаемую аномалию, исследователи могут более эффективно направлять дальнейшие теоретические разработки и уточнять модели, описывающие взаимодействие частиц. Такой подход позволяет сосредоточить усилия на наиболее перспективных направлениях поиска новой физики, выходящей за рамки Стандартной модели, и способствует более глубокому пониманию фундаментальных законов природы.

Анализ с использованием SHAP-значений позволил установить ограничение на время жизни частиц, подобных аксионам (Axion-Like Particles, ALP), показав, что произведение скорости света на время жизни $cτ$ должно быть больше или равно 80 см. Это ограничение существенно для теоретических исследований, направленных на понимание аномалии в распаде $B \rightarrow K\nu\nu$ . Более того, применение машинного обучения, подкрепленное анализом SHAP-значений, повышает достоверность результатов, полученных при анализе сложных наборов данных, и способствует обнаружению новых физических сигналов, которые могли бы остаться незамеченными при традиционных методах анализа. Таким образом, данный подход не только уточняет параметры известных частиц, но и открывает новые возможности для поиска за пределами Стандартной модели.

Исследование, представленное в данной работе, демонстрирует стремление к оптимизации сложных статистических процедур, применяемых в физике высоких энергий. Авторы используют алгоритмы машинного обучения, в частности XGBoost, для аппроксимации функций правдоподобия и эффективного исследования пространства параметров. Этот подход позволяет ускорить процесс глобальной подгонки данных, что особенно важно при анализе огромных массивов информации, таких как те, что получены в эксперименте Belle II. Как говорил Нильс Бор: «Противоположности не противоречат друг другу, а дополняют». В контексте данной работы, точность и скорость, традиционно считающиеся противоположными характеристиками, успешно объединяются благодаря применению машинного обучения, позволяя достичь более глубокого понимания физических процессов.

Что впереди?

Настоящая работа демонстрирует не столько победу над сложностью статистических подгонок, сколько искусство её обхода. Подобно тому, как опытный мастер не ломает узел, а находит способ обойти его, здесь машинное обучение выступает не заменой традиционным методам, а инструментом для смягчения их ограничений. Очевидно, что предложенный подход не устраняет фундаментальные проблемы, связанные с поиском в многомерных пространствах параметров, но позволяет замедлить процесс старения модели, отсрочить неизбежный момент, когда вычислительные ресурсы станут неадекватны задаче.

Наиболее интересным представляется не столько совершенствование алгоритмов машинного обучения, сколько развитие методов интерпретации их результатов. Значение SHAP, представленное в данной работе, — лишь первый шаг к пониманию того, как “мыслят” эти суррогатные модели. Мудрые системы не борются с энтропией, они учатся дышать вместе с ней, и в данном случае это означает принятие неопределенности, присущей любым приближениям. Иногда наблюдение — единственная форма участия.

В перспективе, возможно, стоит отойти от стремления к “глобальной” подгонке как таковой. Вместо этого, системы, как и люди, со временем учатся не спешить. Поиск локальных максимумов, тщательно изученных и интерпретированных, может оказаться более плодотворным, чем тщетные попытки охватить необъятное. Ведь, в конечном счете, каждая модель — это лишь карта, а не сама территория.

Оригинал статьи: https://arxiv.org/pdf/2604.07520.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-11 03:32