Международная команда физиков предложила новый тип триггера высокого уровня на базе фермы из 500 видеокарт. Такое устройство поможет регистрировать и анализировать данные в эксперименте LHCb на Большом адронном коллайдере. Новый триггер использует для анализа центральные процессоры (CPU), а только графические (GPU). Это позволяет удешевить технологию и уменьшить размер кластера. Исследование доступно на страницах журнала Computing and Software for Big Science.
Большой адронный коллайдер и эксперимент LHCb создавался исследователями для поиска Новой физики — области науки, которая выходит за рамки Стандартной модели. Однако пока эксперимент не позволил найти принципиально новые типы частиц. Многие физики считают, что для получения результатов необходимо значительно увеличить статистику столкновений частиц на БАК. Для этого требуется не только новое ускорительное оборудование, которое будет установлено в 2021-2022 годах, но и более совершенные системы обработки данных.
Чтобы достоверно регистрировать события в эксперименте LHCb необходимо, чтобы траектория зарегистрированной частицы совпадала с моделью, предложенной алгоритмом. Если совпадения отсутствуют, то измерения отсеиваются. Такую участь ожидает примерно 70% всех столкновений на БАК, а значит для проведения предварительного анализа необходимы значительные вычислительные мощности.
Международный коллектив физиков, в который также вошли ученые из НИУ ВШЭ, представили новый алгоритм анализа данных. Он основан на использовании фермы из видеокарт. Она используется в качестве триггера первого уровня (HLT1) для регистрации и распознавания событий на детекторе эксперимента LHCb. Технология получила название Allen — в честь Фрэнсис Аллен, исследователя в области теории вычислительных систем и первой женщины, получившей Премию Тьюринга.
В отличие от более ранних триггеров, новая система предполагает перенос обработки данных с центральных процессоров на графические. Это могут быть как профессиональные решения (вплоть до графических систем Tesla, наиболее продвинутых на рынке), так и обычные «геймерские» видеокарты от NVIDIA или AMD. За счёт этого триггер Allen не привязан ни к одному конкретному вендору оборудования, что упрощает его создание и уменьшает цену. При использовании наиболее производительных систем, скорость обработки информации триггером может достигать 40 терабит в секунду.
В традиционной схеме информация поступает от детектора на триггер нулевого уровня (L0), который состоит из программируемых микросхем. Они отсеивают данные на элементарном уровне. Новая схема не содержит L0. В ней данные сразу поступают на ферму, в которой каждый из 500 процессоров параллельно обрабатывает до нескольких тысяч событий в секунду, а весь кластер целиком — миллионы.
После первичной регистрации и распознавания события в обычные x86-процессоры триггеров второго уровня (HLT2) приходят только отобранные данные. При этом основная вычислительная нагрузка переходит на ферму, где информация обрабатывается только благодаря графическим процессорам. Такая схема позволяет анализировать и отсеивать события в несколько раз эффективнее. Графический процессор представляет собой многопоточную систему с большим количеством ядер. И если центральные процессоры ориентированы на последовательную обработку информации, то графические созданы для массивных параллельных вычислений. Кроме того, у них специализированный и ограниченный набор команд, что дополнительно поднимает производительность.