作为极光早期科学计划的一部分,阿贡国家实验室的沃尔特霍普金斯正在领导一个项目,该项目将使用百亿亿级计算能力来帮助寻找新的物理发现。
当 Aurora 于2022 年到达时,美国能源部 ( DOE ) 的阿贡国家实验室将成为美国首批百亿亿级超级计算机之一。为了准备系统架构和规模的代码, 15 个研究团队正在通过美国能源部科学用户设施办公室阿贡领导计算设施 ( ALCF )参与 Aurora 早期科学计划。有了超级计算机上的预生产时间,这些研究人员将成为世界上第一批使用百亿亿级计算机进行科学研究的人。
早在公元前5 世纪左右,早期的哲学家就首次提出了原子的概念。就在我们以为我们了解了它的基本结构——质子、中子和电子时——理论和技术的出现证明了我们是错误的。事实证明,还有更多基本粒子,如夸克,由恰当命名的胶子结合在一起。
物理学家在我们称为对撞机的巨大机器野兽中发现了许多这些和其他粒子,有助于发展我们今天所知的物理学标准模型。但仍有一些问题继续唠叨:还有更基本的东西吗?标准模型是全部吗?
决心找出答案,高能物理学界正在努力将更大的对撞机和更复杂的探测器与百亿亿级计算系统集成在一起。其中之一是沃尔特·霍普金斯大学的助理物理学家阿贡国家实验室,并与合作者 ATLAS实验 在 大型强子对撞机(LHC) 在欧洲核子研究中心,瑞士日内瓦附近。
霍普金斯与来自阿贡和劳伦斯伯克利国家实验室的研究人员合作,通过ALCF领导了一个 Aurora 早期科学计划项目, 为百亿亿级计算架构 准备用于LHC模拟的软件,包括阿贡即将推出的百亿亿级机器 Aurora。Aurora 每秒进行 10 亿次计算,处于超级计算的前沿,相当于粒子物理学的下一个挑战,这是一个巨大的挑战。
该项目是由物理学家和阿贡杰出研究员 James Proudfoot 于几年前启动的,他了解百亿亿次在提高这种复杂科学的影响方面的独特优势。
使代码与新架构保持一致
LHC 中产生的碰撞发生在几个探测器之一。团队关注的那个ATLAS见证了每秒数十亿次的粒子相互作用以及这些碰撞在其尾迹中产生的新粒子的特征。
该团队关注的一种代码称为事件生成器,它模拟在17英里圆周对撞机环内的交互点处发生的底层物理过程。让软件生成的物理与标准模型的物理保持一致有助于研究人员准确模拟碰撞并预测残余粒子的类型、路径和能量。
以这种方式检测物理会产生大量数据,并且需要同样大量的计算机时间。现在,欧洲核子研究中心正在加大赌注,准备升级LHC的光度,允许更多的粒子相互作用和20倍的数据输出增加。
虽然团队希望 Aurora 来处理他们模拟需求的增加,但机器本身也面临一些挑战。
直到最近,事件生成器都在计算机 CPU(中央处理单元)上运行。虽然它们工作得很快,但一个CPU通常一次只能执行几个操作。
Aurora 将配备 CPU 和 GPU(图形处理单元),这是各地游戏玩家的选择。GPU 可以通过将它们分解成分散在许多内核上的数千个较小的任务来处理许多操作,这些任务是驱动这两种类型单元的引擎。
但霍普金斯指出,以有效的方式将基于 CPU 的模拟转移到 GPU 上需要付出很多努力。因此,为应对 Aurora 和来自LHC的新数据的冲击而采取这一举措会带来一些挑战,这些挑战已成为该团队的核心重点。
“我们希望能够用极光来帮助我们应对这些挑战,”霍普金斯说, “但它需要我们研究计算架构是新的我们和我们的代码库。例如,我们专注于ATLAS 中使用的生成器,称为 MadGraph,它在 GPU 上运行,GPU 更并行且具有不同的内存管理要求。”
粒子相互作用模拟代码 MadGraph 由国际高能物理理论家团队编写,支持LHC的模拟需求。
仿真和人工智能支持实验工作
在LHC起到了使预测现实显著的作用。最著名的是,标准模型预测了希格斯玻色子的存在,它将质量传递给所有基本粒子;ATLAS及其对应的探测器CMS在2012 年证实了希格斯粒子的存在。
但是,正如科学中经常发生的情况一样,重大发现可能会导致更多实质性问题,其中许多问题是标准模型无法预测的。为什么希格斯粒子是它的质量?什么是暗物质?
“对大型强子对撞机进行如此大规模升级的原因是我们希望在大海捞针中找到那根针,我们会在数据集中找到一些异常,它提供了超出标准模型的物理暗示,”霍普金斯说.
计算能力、模拟、实验和人工智能 ( AI ) 的结合将通过提供预测和识别的准确性来极大地帮助搜索。
例如,当ATLAS探测器目睹这些粒子碰撞时,它会将它们记录为电子信号。这些被重建为可能对应于通过的电子的能量爆发的像素。
“但就像在人工智能中,典型的例子是识别图像中的猫和狗,我们有算法来识别这些电子信号并将其重建为电子、质子和其他东西,” ALCF计算机科学家 Taylor Childers 说,他是该团队的成员.
然后将来自真实碰撞事件的重建数据与模拟数据进行比较,以寻找模式差异。这就是物理模型的准确性发挥作用的地方。如果它们工作正常并且真实数据和模拟数据不匹配,您将继续测量并排除异常,直到您很可能找到那根不符合标准模型的针。
该团队还使用人工智能来量化不确定性,以确定他们正确识别粒子的可能性。
人类能够在有限的范围内识别粒子——动量和位置等几个参数可能会告诉我们某个粒子是电子。但是,根据10 个密切相关的参数进行表征,则完全是另一回事。
“这就是人工智能真正发挥作用的地方,特别是如果这些输入参数是相关的,比如电子周围粒子的动量和电子本身的动量,”霍普金斯说。“这些相关性是很难对付的分析,但因为我们有这么多的模拟数据,我们可以教人工智能,它可以告诉我们,这是与该可能性的电子因为我有所有这些输入信息。”
百亿亿级计算和前进的道路
在 Aurora 之前,该团队继续研究新架构的编程语言以及在将在 Aurora 上使用的英特尔硬件以及其他供应商的硬件上运行的代码。
“将R的部分& d,我们与我们的合作伙伴,英特尔,是确保硬件是做什么我们希望它做的和有效的做这件事,说:”奇尔德斯。“拥有一个像极光机器会给我们巨大的计算能力和大量的节点,有效地减少时间的解决方案,尤其是当我们移动到升级后的LHC。”
解决方案是对一个基本问题的回答——标准模型之外还有更多吗?——霍普金斯指出,一百年后可能会产生难以想象的影响。
“基础研究可以为我们提供可能导致社会变革的知识,但如果我们不进行研究,就不会产生任何结果,”他说。
该ALCF是美国能源部科学办公室的用户工具。
该项目的资金由美国能源部科学办公室提供:高能物理和先进科学计算研究办公室。ATLAS是一项受益于DOE支持的国际合作项目。
===========
阿贡领导力计算设施为科学和工程界提供超级计算能力,以促进广泛学科的基础发现和理解。在美国能源部 ( DOE ) 科学办公室、高级科学计算研究 ( ASCR ) 计划的支持下,ALCF是美国致力于开放科学的两个DOE领导计算设施之一。
阿贡国家实验室寻求解决紧迫的国家科学技术问题。作为美国第一个国家实验室,阿贡几乎在所有科学学科中开展前沿的基础和应用科学研究。阿贡的研究人员与来自数百家公司、大学以及联邦、州和市政机构的研究人员密切合作,帮助他们解决具体问题,提升美国的科学领导地位,并为国家更美好的未来做好准备。从以上员工60个国家,阿贡由管理UChicago阿贡,LLC在美国能源部的科学办公室。
美国能源部科学办公室是美国物理科学基础研究的最大支持者,致力于解决我们这个时代一些最紧迫的挑战。如需更多信息,请访问https:// ener gy .gov/ s c ience。