(图片:欧洲核研究组织)
在探索发现自然的基本粒子和力量的过程中,高能量实验所面临的关键挑战之一是 大型强子对撞机 正在确保所收集的大量数据的质量。为此,为实验的各种子探测器建立了数据质量监测系统,并在检查数据的准确性方面发挥了重要作用。
其中一个子探测器是 通信管理系统 电磁量热计(ECAL),它是碳纤维中的一个重要组成部分 探测器 .ECAL测量在LHC碰撞中产生的粒子的能量,主要是电子和光子,这使物理学家能够重建粒子的衰变。确保ECAR记录数据的准确性和可靠性对于实验的成功运行至关重要。
在目前正在进行的大型强子对撞机第三次运行期间,管理系统研究人员开发并部署了一种创新的机器电子学习技术,以加强目前的ECAL数据质量监测系统。在最近的一份出版物中详细说明,这种新方法有望使数据异常检测更加准确和有效。这种实时能力对于快速检测和纠正探测器问题至关重要,这反过来又提高了数据的总体质量。新系统是 部署的 在2022年埃卡尔河的桶里,在2023年的终端盖里。
传统的管理系统数据质量监测系统由传统软件组成,该软件依靠预先确定的规则、阈值和人工检查相结合,以提醒控制室中的团队注意潜在的探测器问题。这种方法涉及为什么构成正常数据行为和标记偏差设定具体标准。这些方法虽然有效,但可能会忽略不符合预先定义模式的微妙或意外异常。
相比之下,基于机器学习的新系统能够发现这些异常现象,补充了传统的数据质量监测系统。它接受培训,从现有的良好数据中识别正常的探测器行为,并检测任何偏差。该方法的基石是基于自编码异常检测系统。自动编码器是一种专门的神经网络,是为无监督学习任务而设计的。
这张来自ECAL数据异常区域(左)的图片,当通过机器电子学习系统时,会在右侧生成容易识别的颜色图,显示红色的异常区域和绿色的好区域。(图像:中央气象系统实验)
该系统以二维图像的形式提供ECAL数据,它还擅长于通过新的校正策略发现随着时间的推移而演变的异常现象。这一方面对于识别可能不会立即显现但会逐渐发展的模式至关重要。
这种新型的自动编码系统不仅提高了cms探测器的性能,而且还充当了跨领域实时异常检测的模型,突显了人工智能的变革潜力。例如,管理大规模高速数据流的行业,如金融、网络安全和保健行业,可以从类似的异常检测机器学习系统中获益,从而提高其操作效率和可靠性。