Как графовые нейросети находят непредвиденные аномалии на коллайдере

В современном мире экспериментальной физики обработка огромных массивов данных сталкивается с ограничениями человеческой интуиции и классических алгоритмов. Профессор Калифорнийского университета в Ирвайне Дэниел Уайтсон в лекции для канала физика Брайана Китинга рассказал о революционном подходе к поиску аномальных траекторий элементарных частиц с помощью искусственного интеллекта. Этот метод позволяет выйти за рамки привычных моделей и обнаружить явления, которые ранее считались принципиально неуловимыми.

🎛️ От «ручного» поиска к большим данным: эволюция трекинга частиц 0:00

В эпоху зарождения физики элементарных частиц открытие новых явлений могло происходить на уровне единичных событий. Как иронично отмечает Дэниел Уайтсон, когда сигналы были сильными, а фоновый шум — низким, обнаружение одного позитрона давало соотношение объема данных к Нобелевской премии один к одному. В те времена обработка данных велась людьми, чьи возможности мозга идеально подходили для визуального распознавания образов: ученые буквально смотрели на снимки и фиксировали треки частиц.

Однако сегодня ситуация кардинально изменилась:

Данные поступают петабайтами, а частицы сталкиваются в детекторах на скоростях, близких к скорости света.
Современные открытия (например, бозона Хиггса) носят исключительно статистический характер, поскольку новые сигналы крайне редкие и скрыты за колоссальным объемом фонового шума.
Масштаб задачи делает «брутфорс» (прямой перебор комбинаций) невозможным: при наличии 10 000 сигнальных точек (хитов) и 1000 частиц число математических вариантов распределения точек по трекам огромно.

Поэтому современная экспериментальная физика вынуждена полагаться на алгоритмы автоматической реконструкции траекторий (трекинга). По мнению Дэниела Уайтсона, долгое время машинное обучение использовалось в этой сфере преимущественно для оптимизации и сжатия существующих процессов, а не для совершения принципиально новых открытий. Гость выразил надежду, что новые инструменты позволят вернуться к «полке с невозможными задачами» и переосмыслить их.

🧱 Стена допущений: почему физики пропускают самое интересное 5:09

Чтобы сделать вычислительную задачу трекинга решаемой, классические алгоритмы исторически опираются на два фундаментальных допущения:

Подразумевается, что частицы рождаются непосредственно в точке столкновения (вершине взаимодействия), так как именно оттуда исходит большинство искомых объектов. Ограничение поиска траекторий этой вершиной драматически сокращает число комбинаций.
Предполагается, что заряженные частицы под действием постоянного магнитного поля детектора движутся строго по спирали (хелису).

Дэниел Уайтсон подчеркивает, что эти допущения искусственно ограничивают область потенциальных открытий. Если частица не движется по спирали или рождается вдали от вершины взаимодействия, существующие системы ее просто не увидят. И если для поиска частиц, возникающих со смещением от вершины, уже сформировалась целая исследовательская группа (в которой участвует и один из постдоков Уайтсона), то поиску неспиральных траекторий уделялось значительно меньше внимания.

Причина кроется в архитектуре традиционных алгоритмов (таких как фильтры Калмана): они тесно связывают процесс поиска (finding) трека и его математической подгонки (fitting) под модель. Алгоритм находит небольшой отрезок из нескольких точек, аппроксимирует его спиралью, прогнозирует положение следующей точки и отсекает все, что не попадает в узкий коридор неопределенности. Найти нечто иное в рамках такой парадигмы невозможно. Гость заявляет о необходимости создания инструментов, способных обнаружить неожиданные траектории без предварительно заданной математической формы.

🕸️ Графовые сети как ключ к «невозможным» открытиям 8:53

Решение проблемы пришло благодаря наработкам коллаборации ExaTrack и других ученых, которые создали принципиально новый метод трекинга на базе графовых нейросетей (GNN). Изначально они решали задачу работы в условиях экстремально высокой плотности частиц (pileup), где классические методы давали сбой.

Главная ценность этого подхода, по словам Дэниела Уайтсона, заключается в том, что нейросетевой трекинг полностью разделил этапы поиска и подгонки траекторий. Графовый трекер изначально не имеет встроенного предположения о спиральности; он учится этому на примерах. Пайплайн переводит массив координатных точек (хитов) детектора в абстрактное латентное пространство.

Обучение строится так, чтобы точки, принадлежащие одному треку, оказывались в латентном пространстве рядом (кластеризовались), а чужеродные точки — далеко друг от друга. Модель сначала группирует массив хитов в единый трек, и только затем его можно анализировать на соответствие спирали. Именно эта независимость открывает путь к фиксации аномалий.

🌀 Охота на «кверки»: первый шаг к поиску аномалий 10:36

В качестве первого практического теста команда Дэниела Уайтсона выбрала гипотетические частицы — «кверки» (quirks), предложенные теоретиками из Калифорнийского университета в Дейвисе. Согласно теории, кверки обладают не только электромагнитным зарядом, но и зарядом в рамках гипотетической «темной квантовой хромодинамики» (dark QCD).

Из-за высокой массы кверков и специфического масштаба удержания (конфайнмента) энергетическая трубка между ними не рвется с рождением новых легких частиц, как это происходит в обычной КХД. В результате пара созданных кверков начинает совершать макроскопические колебания прямо внутри детектора, вырисовывая причудливые зигзагообразные траектории.

Для проверки применимости ИИ ученые провели серию тестов:

Сгенерировали треки кверков в программе MadGraph и пропустили их через симуляторы цилиндрического детектора с 8 и 25 слоями, фиксирующие 3D-координаты пространства.
Уайтсон упомянул забавную историю из академического фольклора: аспирант из Беркли потратил 3 года, пытаясь интегрировать кверки в тяжелый симулятор детектора GEANT, потерпел неудачу и покинул физику. Однако сейчас аспирант из Ирвайна успешно решает эту задачу для проекта PHASER.
Исследователи Макс Файс (Max Fice, ныне постдок в Фермилабе) и Ши Ю Шао (Shi Yu Shao, Пекин) применили нейросетевой пайплайн без допущения о спиральности.
При тестировании классического подхода (обученного только на Стандартной модели) эффективность поиска кверков составила всего 11%, причем обнаруживались лишь те редкие треки, которые случайно походили на спирали.
После адаптации пайплайна (пришлось отключить допущение, что порядок точек строго привязан ко времени, так как кверки могут петлять назад) ИИ успешно научился распознавать и собирать такие траектории.

Даже в условиях реалистичного моделирования, когда треки кверков буквально тонули в шуме фоновых событий Стандартной модели (для этого на каждое событие кверков искусственно накладывали два фоновых события рождения топ-кварков, TTbar), нейросеть сохраняла высокую эффективность распознавания при крайне низком уровне ложных срабатываний (fake rate).

Чтобы оценить фоновые шумы, Уайтсон написал специальный «кверк-фиттер», рассчитывающий соотношение правдоподобия спиральной и кверковой гипотез. Выяснилось, что стандартные частицы могут имитировать кверки только в редких случаях, когда два стандартных трека вылетают спина к спине (back-to-back), создавая иллюзию микроскопического колебания. Правильно выставленный порог отсечения позволяет полностью убрать этот фон.

🌊 Функции Шварца и генерация «любых странных траекторий» 28:30

Конечной целью Дэниела Уайтсона является поиск не просто кверков, а абсолютно любых непредвиденных аномалий. Но как обучить нейросеть искать то, конфигурация чего физикам неизвестна? Аспирант Леви Контини (Levi Contini) предложил ограничить область поиска любыми «гладкими» (бесконечно дифференцируемыми) путями, чтобы алгоритм не принимал случайный мусор и шум за физические объекты.

Для математического описания таких произвольных траекторий был использован аппарат функций Шварца и разложения траектории в базис мод Фурье. Если эмпирическая амплитуда высокочастотных мод Фурье затухает достаточно быстро, траектория гарантированно будет гладкой, без изломов. Ограничивая амплитуду, ученые смогли генерировать случайные выборки гладких аномальных треков, содержащие от 1 до 25 частотных мод.

Результаты тестов показали:

Стандартные трекеры полностью проваливают поиск таких траекторий, за исключением редких случайных совпадений со спиралью.
Обученная на функциях Шварца нейросеть успешно их реконструирует и сохраняет стабильность при смешивании с фоном TTbar.
ИИ продемонстрировал способность к генерализации: модель, обученную на одном наборе функций Шварца (класс А), протестировали на совершенно другом наборе (класс B, за вычетом пересечений). Эффективность поиска осталась высокой.

По мнению Дэниела Уайтсона, это доказывает, что нейросеть не просто зазубривает конкретные примеры, а улавливает само свойство «гладкости» траектории. Фильтрация таких аномалий в реальном детекторе будет происходить за счет отсечения треков с плохими показателями хи-квадрат при попытке подогнать их под стандартную спираль. При этом гость признает, что в реальных условиях с физическими эффектами вещества (многократное рассеяние) эта задача существенно усложнится.

🏎️ Тысячекратное ускорение: нейросети как идеальные фиттеры треков 36:34

Поиск аномалий неотделим от задачи точной параметризации стандартных треков: чтобы найти странное, нужно сначала отфильтровать понятное. Традиционный процесс подгонки (фиттинга) параметров спирали по точкам является узким местом. Физикам известна прямая функция (от параметров к точкам), но обратная функция (от точек детектора к физическим параметрам, таким как импульс или направление) аналитически неизвестна.

Из-за этого классический фиттинг превращается в ресурсоемкое сканирование пространства параметров в поисках математического минимума. Уайтсон полушутя отмечает, что в каждом крупном эксперименте на коллайдере есть «какой-нибудь русский парень», чья единственная работа — настраивать и чинить этот безумный трек-фиттер, изобилующий локальными минимумами. Кроме того, традиционные методы жестко завязаны на предположение о гауссовом шуме и оптимизируют прокси-величину (расстояние от трека до точек), хотя физиков интересуют сами параметры — кривизна и импульс.

Команда Уайтсона поручила студенту разработать нейросеть, которая напрямую сопоставляет хиты с параметрами спирали. Результаты оказались прорывными:

В условиях идеального гауссова шума ИИ в точности воспроизводит результаты эталонного метода наименьших квадратов.
В сложных сценариях (наличие многократного рассеяния электронов, асимметричные шумы) нейросеть превосходит классику, поскольку все эти эффекты можно заложить в симуляцию неявно — сеть выучит их по примерам, избавляя физиков от необходимости прописывать сложные аналитические модели шума.
Скорость работы нейросетевого фиттера оказалась примерно в 1000 раз выше, чем у традиционных поисковых оптимизаторов.

В итоге разделение трекинга на независимый поиск и высокоскоростной фиттинг открывает перед экспериментальной физикой принципиально новые горизонты как в области поиска Новой физики, так и в оптимизации обработки колоссальных объемов данных на современных коллайдерах.