Американские физики применили идеи машинного обучения для поиска среди экспериментальных данных распадов бозона Хиггса. Для этого они свели задачу к минимизации энергии в спиновой модели Изинга и построили сильный классификатор, который оказался устойчив к переобучению. Минимум ученые искали с помощью алгоритма имитации отжига и квантового отжига (в последнем случае расчеты выполнялись на компьютере D-Wave). Статья опубликована в Nature.
Для исследования свойств недавно открытого на LHC бозона Хиггса необходимо отбирать с высокой точностью события, отвечающие образованию и распаду бозона. Задача осложняется тем, что эти события происходят относительно редко, и приходится обрабатывать большие массивы экспериментальных данных. Методы машинного обучения могут сильно упростить эту задачу.
В данной работе физики исследовали распад хиггсовского бозона на два фотона, описываемый следующими диаграммами Фейнмана (на рисунке ниже). Процесс определяется импульсами бозона и фотонов, углом между исходным и конечным пучками и углом разлета фотонов. Однако на опыте померить эти параметры трудно, поэтому физики сконструировали из них восемь кинематических переменных, которые можно измерить непосредственно. Потом ученые собрали из этих величин тридцать шесть произведений, которые использовали в качестве параметров для обучения слабого классификатора.
Чтобы разработать более сильный классификатор, физики адаптировали для своей задачи модель Изинга. Набору из используемых для обучения переменных они сопоставили вектор в тридцатишестимерном пространстве, а принадлежности событию распада бозона — псевдоспин (равный единице, если распад зафиксирован, и минус единице в противном случае). Затем физики записали стандартное выражение для энергии в модели Изинга. Минимизируя эту энергию, можно найти некоторую конфигурацию спинов, которую затем можно использовать для построения классификатора событий распада. Также для предотвращения переобучения ученые ввели в модель параметр лямбда.
Конфигурацию спинов, минимизирующую энергию и используемую сильным классификатором, ученые искали с помощью алгоритма имитации отжига и квантового отжига. Во втором случае вычисления проводились на компьютере D-Wave, оперирующем 1098 кубитами. Также исследователи сравнили работу алгоритмов с работой сети глубокого обучения (deep mind network, DMN) и ансамблем усиленных деревьев решений (ensemble of boosted decision trees) с использованием алгоритма усиления XGBoost (XGB).
Для данных четырех алгоритмов физики построили кривые ошибок для обучающей выборки из 100 и 20000 событий. На графиках можно заметить, что алгоритмы отжига отличаются от DMN и XGB, превосходя их на небольших выборках и немного проигрывая на больших. Ученые отмечают, что в данной работе квантовый отжиг затруднился найти истинный минимум энергии, хотя и смог выявить события распада бозона. Это может быть следствием того, что текущее поколение компьютеров D-Wave страдает от погрешностей при вычислении гамильтониана, которыми нельзя пренебречь.
Также проверив работу классификатора для различных значений параметра лямбда, физики выявили три динамические переменные, которые вносят наибольший вклад в отбор процессов. Физическая причина важности для классификатора именно этих переменных заключается в массивности бозона Хиггса. Из-за этого факта образование фотонов с большим поперечным импульсом оказывается затруднено, что позволяет относительно надежно отличить события с участием бозона от фоновых процессов.
Ранее мы писали о том, как машинное обучение помогло физикам-теоретикам считать функциональные интегралы.
По информации https://nplus1.ru/news/2017/10/19/higgs-learning
Обозрение "Terra & Comp".