在高能对撞机实验中,重建重粒子(如顶夸克、希格斯粒子、W/Z玻色子等)的关键在于测量它们的衰变产物,如夸克会衰变或强子化形成一簇粒子,从而在探测器中形成喷注,而喷注的起源往往难以判断。传统的算法需要考虑末态粒子所有可能的排列组合及其系统误差,随着对撞机的能量、亮度的提升,喷注数量增加,可能的排列组合数量会呈指数级增长,这使得将信号来源正确分配给各个粒子成为一项重要的挑战。
为了解决这一问题,研究人员开发了一种被称为“保持对称性的注意力机制”(Symmetry Preserving Attention NETwork,简称SPA-NET)的机器学习算法。注意力机制是Transformer架构的基础,以用于Chat-GPT而闻名。与常规注意力机制不同,这种算法除具备置换不变性外还能够有效保持如两体或三体衰变过程的对称性。此外,这种算法的新功能还能处理各种类型的物理对象(如轻子、喷注、丢失的横向动量),得益于Transformer架构其能同时进行回归分析和事件分类,提高了处理效率和准确性。
利用该算法,研究人员在LHC的三个旗舰分析(寻找ttH(bb),顶夸克质量测量,寻找假想重粒子Z’)中用简化探测器模拟(Delphes)数据进行了测试。在LHC Run 2(3)数据统计中,SPA-NET的ttH和Z’信号灵敏度预计能达到3(5)σ,这是传统方法无法比拟的。此外,在LHC Run 2数据统计中,使用该算法测量得到的顶夸克质量的精度与传统方法相比提高了15%。这些数据表明,相较于传统方法和其它机器学习方法,SPA-NET显著提高了测量精度和对新物理的灵敏度,是目前最高效、表现最好的多对象事件选择方法。
这种新的机器学习算法有望在更多的物理分析中应用,为LHC和未来的对撞机物理研究提供创新方法。
图1:保持对称性的扩展注意力机制(SPA-NET)的架构示意图
图2:区分ttH信号和本底事例的特征曲线(ROC curve)。