Как графовые нейросети находят непредвиденные аномалии на коллайдере

Brian Keating 13 тыс. 45 мин 7 мин 27.12.2025
Главное

В современном мире экспериментальной физики обработка огромных массивов данных сталкивается с ограничениями человеческой интуиции и классических алгоритмов. Профессор Калифорнийского университета в Ирвайне Дэниел Уайтсон в лекции для канала физика Брайана Китинга рассказал о революционном подходе к поиску аномальных траекторий элементарных частиц с помощью искусственного интеллекта. Этот метод позволяет выйти за рамки привычных моделей и обнаружить явления, которые ранее считались принципиально неуловимыми.

🎛️ От «ручного» поиска к большим данным: эволюция трекинга частиц 0:00

В эпоху зарождения физики элементарных частиц открытие новых явлений могло происходить на уровне единичных событий. Как иронично отмечает Дэниел Уайтсон, когда сигналы были сильными, а фоновый шум — низким, обнаружение одного позитрона давало соотношение объема данных к Нобелевской премии один к одному. В те времена обработка данных велась людьми, чьи возможности мозга идеально подходили для визуального распознавания образов: ученые буквально смотрели на снимки и фиксировали треки частиц.

Однако сегодня ситуация кардинально изменилась:

Поэтому современная экспериментальная физика вынуждена полагаться на алгоритмы автоматической реконструкции траекторий (трекинга). По мнению Дэниела Уайтсона, долгое время машинное обучение использовалось в этой сфере преимущественно для оптимизации и сжатия существующих процессов, а не для совершения принципиально новых открытий. Гость выразил надежду, что новые инструменты позволят вернуться к «полке с невозможными задачами» и переосмыслить их.

🧱 Стена допущений: почему физики пропускают самое интересное 5:09

Чтобы сделать вычислительную задачу трекинга решаемой, классические алгоритмы исторически опираются на два фундаментальных допущения:

  1. Подразумевается, что частицы рождаются непосредственно в точке столкновения (вершине взаимодействия), так как именно оттуда исходит большинство искомых объектов. Ограничение поиска траекторий этой вершиной драматически сокращает число комбинаций.
  2. Предполагается, что заряженные частицы под действием постоянного магнитного поля детектора движутся строго по спирали (хелису).

Дэниел Уайтсон подчеркивает, что эти допущения искусственно ограничивают область потенциальных открытий. Если частица не движется по спирали или рождается вдали от вершины взаимодействия, существующие системы ее просто не увидят. И если для поиска частиц, возникающих со смещением от вершины, уже сформировалась целая исследовательская группа (в которой участвует и один из постдоков Уайтсона), то поиску неспиральных траекторий уделялось значительно меньше внимания.

Причина кроется в архитектуре традиционных алгоритмов (таких как фильтры Калмана): они тесно связывают процесс поиска (finding) трека и его математической подгонки (fitting) под модель. Алгоритм находит небольшой отрезок из нескольких точек, аппроксимирует его спиралью, прогнозирует положение следующей точки и отсекает все, что не попадает в узкий коридор неопределенности. Найти нечто иное в рамках такой парадигмы невозможно. Гость заявляет о необходимости создания инструментов, способных обнаружить неожиданные траектории без предварительно заданной математической формы.

🕸️ Графовые сети как ключ к «невозможным» открытиям 8:53

Решение проблемы пришло благодаря наработкам коллаборации ExaTrack и других ученых, которые создали принципиально новый метод трекинга на базе графовых нейросетей (GNN). Изначально они решали задачу работы в условиях экстремально высокой плотности частиц (pileup), где классические методы давали сбой.

Главная ценность этого подхода, по словам Дэниела Уайтсона, заключается в том, что нейросетевой трекинг полностью разделил этапы поиска и подгонки траекторий. Графовый трекер изначально не имеет встроенного предположения о спиральности; он учится этому на примерах. Пайплайн переводит массив координатных точек (хитов) детектора в абстрактное латентное пространство.

Обучение строится так, чтобы точки, принадлежащие одному треку, оказывались в латентном пространстве рядом (кластеризовались), а чужеродные точки — далеко друг от друга. Модель сначала группирует массив хитов в единый трек, и только затем его можно анализировать на соответствие спирали. Именно эта независимость открывает путь к фиксации аномалий.

🌀 Охота на «кверки»: первый шаг к поиску аномалий 10:36

В качестве первого практического теста команда Дэниела Уайтсона выбрала гипотетические частицы — «кверки» (quirks), предложенные теоретиками из Калифорнийского университета в Дейвисе. Согласно теории, кверки обладают не только электромагнитным зарядом, но и зарядом в рамках гипотетической «темной квантовой хромодинамики» (dark QCD).

Из-за высокой массы кверков и специфического масштаба удержания (конфайнмента) энергетическая трубка между ними не рвется с рождением новых легких частиц, как это происходит в обычной КХД. В результате пара созданных кверков начинает совершать макроскопические колебания прямо внутри детектора, вырисовывая причудливые зигзагообразные траектории.

Для проверки применимости ИИ ученые провели серию тестов:

Даже в условиях реалистичного моделирования, когда треки кверков буквально тонули в шуме фоновых событий Стандартной модели (для этого на каждое событие кверков искусственно накладывали два фоновых события рождения топ-кварков, TTbar), нейросеть сохраняла высокую эффективность распознавания при крайне низком уровне ложных срабатываний (fake rate).

Чтобы оценить фоновые шумы, Уайтсон написал специальный «кверк-фиттер», рассчитывающий соотношение правдоподобия спиральной и кверковой гипотез. Выяснилось, что стандартные частицы могут имитировать кверки только в редких случаях, когда два стандартных трека вылетают спина к спине (back-to-back), создавая иллюзию микроскопического колебания. Правильно выставленный порог отсечения позволяет полностью убрать этот фон.

🌊 Функции Шварца и генерация «любых странных траекторий» 28:30

Конечной целью Дэниела Уайтсона является поиск не просто кверков, а абсолютно любых непредвиденных аномалий. Но как обучить нейросеть искать то, конфигурация чего физикам неизвестна? Аспирант Леви Контини (Levi Contini) предложил ограничить область поиска любыми «гладкими» (бесконечно дифференцируемыми) путями, чтобы алгоритм не принимал случайный мусор и шум за физические объекты.

Для математического описания таких произвольных траекторий был использован аппарат функций Шварца и разложения траектории в базис мод Фурье. Если эмпирическая амплитуда высокочастотных мод Фурье затухает достаточно быстро, траектория гарантированно будет гладкой, без изломов. Ограничивая амплитуду, ученые смогли генерировать случайные выборки гладких аномальных треков, содержащие от 1 до 25 частотных мод.

Результаты тестов показали:

По мнению Дэниела Уайтсона, это доказывает, что нейросеть не просто зазубривает конкретные примеры, а улавливает само свойство «гладкости» траектории. Фильтрация таких аномалий в реальном детекторе будет происходить за счет отсечения треков с плохими показателями хи-квадрат при попытке подогнать их под стандартную спираль. При этом гость признает, что в реальных условиях с физическими эффектами вещества (многократное рассеяние) эта задача существенно усложнится.

🏎️ Тысячекратное ускорение: нейросети как идеальные фиттеры треков 36:34

Поиск аномалий неотделим от задачи точной параметризации стандартных треков: чтобы найти странное, нужно сначала отфильтровать понятное. Традиционный процесс подгонки (фиттинга) параметров спирали по точкам является узким местом. Физикам известна прямая функция (от параметров к точкам), но обратная функция (от точек детектора к физическим параметрам, таким как импульс или направление) аналитически неизвестна.

Из-за этого классический фиттинг превращается в ресурсоемкое сканирование пространства параметров в поисках математического минимума. Уайтсон полушутя отмечает, что в каждом крупном эксперименте на коллайдере есть «какой-нибудь русский парень», чья единственная работа — настраивать и чинить этот безумный трек-фиттер, изобилующий локальными минимумами. Кроме того, традиционные методы жестко завязаны на предположение о гауссовом шуме и оптимизируют прокси-величину (расстояние от трека до точек), хотя физиков интересуют сами параметры — кривизна и импульс.

Команда Уайтсона поручила студенту разработать нейросеть, которая напрямую сопоставляет хиты с параметрами спирали. Результаты оказались прорывными:

В итоге разделение трекинга на независимый поиск и высокоскоростной фиттинг открывает перед экспериментальной физикой принципиально новые горизонты как в области поиска Новой физики, так и в оптимизации обработки колоссальных объемов данных на современных коллайдерах.

💬 Цитаты

«Когда сигналы были сильными, а фоновый шум — низким, обнаружение одного позитрона давало соотношение данных к Нобелевской премии один к одному.»

Дэниел Уайтсон 02:56

«В каждом крупном эксперименте есть какой-нибудь русский парень, чья единственная работа — настраивать и чинить этот безумный трек-фиттер.»

Дэниел Уайтсон 38:55
👥 Спикеры
📚 Упомянутые книги
📖 Термины
Трекинг
Процесс восстановления траектории движения элементарной частицы по точкам ее фиксации в детекторе.
Хелис (спираль)
Стандартная геометрическая форма траектории заряженной частицы в постоянном магнитном поле.
Кверки (quirks)
Гипотетические тяжелые частицы, совершающие макроскопические колебания из-за сил темной квантовой хромодинамики.
Функции Шварца
Математический класс гладких функций, используемый для моделирования бесконечно дифференцируемых траекторий.
Фиттинг
Математическая подгонка экспериментальных точек под определенные физические параметры траектории.
📊 Цифры
⚖️ Другая сторона
Математика и физика Дэниел Уайтсон графовые нейросети трекинг частиц коллайдер ATLAS