Современная экспериментальная физика элементарных частиц сталкивается с колоссальными объемами данных, в которых традиционные алгоритмы могут упускать фундаментальные открытия из-за заложенных в них жестких теоретических ограничений. В лекции профессора Калифорнийского университета в Ирвайне Дэниела Уайтсона, представленной на канале Брайана Китинга, обсуждается революционный подход к поиску аномалий с помощью машинного обучения. Использование граф-сетей позволяет находить нетипичные траектории частиц, которые не способны зафиксировать классические методы, открывая путь к обнаружению «невозможной» новой физики.
🔬 Новая эра в физике частиц: от оптимизации к истинным открытиям 0:00
Экспериментальная физика сегодня работает по четкому принципу: ученые задают точный вопрос, строят колоссальную машину для наблюдений и позволяют Вселенной ответить на него. Профессор Дэниел Уайтсон совмещает фундаментальные исследования на детекторе ATLAS в CERN с разработкой ИИ-методов для анализа данных, изучением нейтронных звезд и проектированием космических телескопов на базе обычных смартфонов. По словам исследователя, сегодня машинное обучение применяется практически повсеместно в физике высоких энергий, однако в основном его роль сводится к рутинной оптимизации.
Традиционно физики используют собственную интуицию, чтобы сжать петабайты поступающих данных до одного-двух измерений для последующего анализа. Однако человеческая интуиция ограничена, а реальные данные никогда не следуют ей идеально. Дэниел Уайтсон выражает надежду, что искусственный интеллект сможет сделать гораздо больше: разрушить стены, мешающие совершать прорывные открытия, и заставить ученых вернуться к «полке с невыполнимыми задачами», которые десятилетиями откладывались в сторону.
В истории науки существовала эпоха открытий по единичным событиям, когда уровень сигналов был чрезвычайно высок, а фоновые шумы минимальны. В качестве примера ученый приводит открытие позитрона: тогда соотношение объема данных к полученной Нобелевской премии составляло один к одному. Сегодня же все «простые» открытия уже сделаны, и физикам приходится иметь дело с редкими сигналами на фоне колоссального шума. Современные открытия, такие как обнаружение бозона Хиггса, носят исключительно статистический характер, что требует принципиального изменения подходов к обработке данных.
🛑 Ограничения классического трекинга и скрытые допущения 4:03
Когда в коллайдере сталкиваются пучки частиц, они разлетаются во всех направлениях, оставляя в слоях детектора лишь отдельные электронные следы — так называемые «хиты» (точки фиксации). Задача трекинга заключается в том, чтобы объединить тысячи разрозненных точек в единые траектории конкретных частиц. В современных условиях эта задача превращается в комбинаторный тупик: если в событии рождается около 1 000 частиц, оставляющих 10 000 хитов, то количество вариантов их распределения математически невозможно перебрать методом грубой силы.
Чтобы сделать эту проблему решаемой, создатели классических алгоритмов заложили в них два фундаментальных допущения:
- Предположение, что все искомые частицы рождаются строго в точке первичного столкновения пучков (вершине взаимодействия).
- Предположение, что траектория любой заряженной частицы в постоянном магнитном поле детектора представляет собой идеальную спираль (геликоид).
Эти допущения радикально сокращают математическую сложность вычислений и отлично работают для 99% стандартных процессов, но они же накладывают жесткие шоры на поиск новой физики. Если в эксперименте рождается аномальная частица, движущаяся не по спирали, классический трекер ее попросту не заметит. По утверждению Дэниела Уайтсона, если физики не ищут траектории произвольной формы, они никогда их не найдут. И если для поиска частиц, рождающихся вне точки столкновения, уже сформировалось отдельное научное сообщество, то проблеме поиска неординарных нелинейных траекторий до последнего времени уделялось незаслуженно мало внимания. Основная причина кроется в том, что гипотеза спирального движения глубоко вшита в математическую основу классических фильтров Калмана.
🕸️ Прорыв ExaTrack: разделение поиска и аппроксимации 9:05
Решение проблемы пришло с неожиданной стороны. Международная коллаборация ExaTrack разрабатывала новые методы трекинга на основе графовых нейронных сетей (GNN). Их изначальной мотивацией было создание алгоритмов, способных эффективно работать в условиях экстремальной плотности частиц, где традиционные методы дают сбой из-за вычислительной перегрузки. Представляя экспериментальные данные в виде графа, ученые фактически изобрели трекинг заново.
Ключевая особенность ИИ-трекинга от ExaTrack заключается в том, что он полностью разделяет два процесса:
- Поиск (Finding) — группировка точек, принадлежащих одной частице.
- Фиттинг (Fitting) — математическое описание параметров траектории.
Нейросеть изначально не имеет встроенного представления о том, что частица должна лететь по спирали. Она выучивает эту закономерность исключительно на предложенных ей тренировочных примерах Стандартной модели. На первом этапе ИИ просто указывает на кластер точек в абстрактном пространстве и говорит: «Я считаю, что эти хиты оставлены одним и тем же объектом». И лишь затем этот трек аппроксимируется формулами. По мнению Дэниела Уайтсона, именно такое разделение задач является идеальным инструментом для обнаружения аномальных объектов, чья форма движения далека от классической спирали.
🌀 Охота за «квирками» из темного сектора 10:36
В качестве первого тестового сценария команда Уайтсона использовала теоретическую модель, разработанную физиками из Калифорнийского университета в Дэвисе. Согласно их гипотезе, в рамках теории темной материи могут существовать так называемые «квирки» (quirks) — тяжелые частицы, обладающие не только электромагнитным зарядом, но и зарядом под действием «темной квантовой хромодинамики» (dark QCD).
В обычной физике при удалении кварков друг от друга энергетическая трубка поля разрывается, порождая новые легкие кварки. Но если масса гипотетических квирков слишком велика, энергии поля не хватает для разрыва трубки. В результате два квирка остаются связанными и начинают совершать масштабные макроскопические колебания. Пролетая через детектор, такая пара выписывает причудливые зигзагообразные и волнообразные траектории.
Для проверки ИИ-трекера ученые сгенерировали события с квирками в программе MadGraph и пропустили их через симулированный детектор, состоящий из 8 и 25 слоев. Дэниел Уайтсон поделился академической байкой о том, что ранее студент из Беркли потратил три года, пытаясь внедрить полноценное моделирование квирков в стандартную для физиков среду GEANT, потерпел неудачу и навсегда ушел из науки. Тем не менее, сейчас аналогичная интеграция успешно ведется в Ирвайне для проекта PHASER.
Зависимость траектории квирка от параметров модели колоссальна:
- При определенном соотношении массы и силы натяжения «темной струны» осцилляции происходят на сантиметровом масштабе, что дает крайне необычные треки.
- При иных параметрах колебания сжимаются до нанометров или растягиваются до огромных размеров, становясь невидимыми для приборов.
Разработанный аспирантами Максом Файсом (ныне постдок в Фермилабе) и Ши Ю Шао (Пекин) ИИ-пайплайн проецирует координатные точки хитов в абстрактное скрытое пространство (latent space). Архитектура сети обучается таким образом, чтобы точки, принадлежащие одной частице, оказывались в этом пространстве близко друг к другу, а чужеродные хиты — разносились как можно дальше.
Эксперимент показал, что классический трекер, обученный на Стандартной модели, находит квирки лишь в 11% случаев — и то лишь тогда, когда их траектории случайно напоминают прямые линии или стандартные спирали. Напротив, нейросеть, в которую добавили примеры колеблющихся траекторий, продемонстрировала высокую эффективность распознавания. ИИ успешно вычленял аномальные треки квирков, даже когда они были искусственно «затоплены» тяжелым фоном стандартных процессов, имитирующих реальные столкновения на БАК. Более того, ИИ продемонстрировал способность к генерализации: модель, обученная на одних параметрах квирков, успешно находила квирки с другими периодами колебаний, что доказывает — сеть улавливает само свойство «необычности», а не просто зазубривает конкретные формы.
📈 Математика Шварца: поиск любых гладких траекторий 28:30
Поиск квирков стал важным шагом, но ученые стремились к большему — создать алгоритм, способный обнаружить аномалию, которую теоретики еще даже не успели спроектировать на бумаге. Задача казалась неразрешимой, ведь невозможно обучить сеть искать «то, не знаю что». Аспирант Леви Контини предложил ввести разумное физическое ограничение: алгоритм должен искать любые гладкие, непрерывно дифференцируемые траектории. Это отсекает хаотичный шум, предполагая, что на частицу действует какая-то неизвестная, но непрерывная физическая сила.
Для математического описания этого пространства путей исследователи применили аппарат функций Шварца. Любая траектория в пространстве раскладывалась в ряд по фурье-модам. Ограничивая амплитуду высокочастотных мод, математическая функция гарантировала, что траектория останется идеально гладкой, без резких изломов и изгибов. Генерируя случайные комбинации из фурье-мод (вплоть до 25 различных частот), ученые получили колоссальный спектр невероятных, закрученных петель и спиралей.
Тестирование подтвердило первоначальные гипотезы:
- Стандартные физические трекеры полностью игнорировали шварцевские гладкие дорожки хитов.
- ИИ-пайплайн, обученный на смеси стандартных частиц и случайных функций Шварца класса А, не только успешно находил их, но и без труда распознавал совершенно новые гладкие траектории класса Б, которых никогда не было в обучающей выборке.
Это стало концептуальным прорывом: нейросеть выучила саму математическую концепцию «гладкости» траектории, абстрагируясь от конкретных физических моделей.
⚡ Ускорение в 1000 раз: нейросетевой фиттинг параметров 36:34
Для практического внедрения ИИ-поиска аномалий на реальном коллайдере необходимо сначала быстро находить и отсеивать миллионы стандартных спиральных треков. В физике этот процесс называется детекцией аномалий. Традиционный фиттинг параметров траектории — это крайне медленный и болезненный процесс. По ироничному замечанию Дэниела Уайтсона, в любом крупном международном эксперименте всегда есть «какой-нибудь русский парень», чья единственная жизненная задача — годами настраивать и калибровать фиттер треков, спасая его от бесконечных локальных минимумов.
Классические математические оптимизаторы страдают от трех фундаментальных изъянов:
- Они требуют колоссального времени, сканируя пространство параметров для каждого отдельного события.
- Они жестко завязаны на допущение, что шум в детекторе распределен строго по Гауссу.
- Они оптимизируют ложную цель — минимизируют расстояние от линии до хитов, в то время как физиков интересуют истинные параметры частицы: ее импульс, направление и кривизна.
Команда Уайтсона перевернула этот подход, заставив глубокую нейросеть обучаться прямому отображению: на вход подаются координаты хитов, на выходе ИИ сразу выдает пять ключевых параметров спирали. В случае идеального гауссова шума нейросеть в точности повторила предельную точность классического метода наименьших квадратов. Однако в сложных реалистичных сценариях — при наличии асимметрии шума, смещений слоев детектора или эффектов множественного рассеяния электронов — ИИ значительно превзошел классику.
Причина тривиальна: все физические искажения и материальные эффекты можно заложить внутрь симуляции обучающей выборки. Нейросеть не нуждается в эксплицитном математическом описании шума, она выучивает его скрытые взаимосвязи неявно. Главным же практическим триумфом новой архитектуры стало быстродействие: нейросетевой расчет параметров траектории выполняется примерно в 1000 раз быстрее, чем классический итеративный поиск по пространству параметров. Это открывает реальные перспективы для интеграции ИИ-трекеров непосредственно в триггерные системы жесткого реального времени на БАК, позволяя перехватывать следы «невозможных» частиц прямо в момент столкновения пучков.