一段时间以来,计算机已经能够快速处理 2D 图像。您的手机可以拍摄数码照片并以多种方式处理它们。然而,在三个维度上处理图像并及时处理要困难得多。数学更复杂,即使在超级计算机上处理这些数字也需要时间。
这是美国能源部 (DOE) 阿贡国家实验室的一组科学家正在努力克服的挑战。人工智能已成为解决大数据处理问题的通用解决方案。对于使用高级光子源 (APS)(位于阿贡的美国能源部科学用户设施办公室)处理 3D 图像的科学家来说,这可能是将 X 射线数据以更快的速度转化为可见、可理解形状的关键。该领域的突破可能会对天文学、电子显微镜和其他依赖大量 3D 数据的科学领域产生影响。
“为了充分利用升级后的 APS 的能力,我们必须重新发明数据分析。我们目前的方法不足以跟上。机器学习可以充分利用并超越目前的可能性,”说阿贡国家实验室的 Mathew Cherukara
该研究团队包括来自 Argonne 三个部门的科学家,他们开发了一种名为 3D-CDI-NN 的新计算框架,并表明它可以从 APS 收集的数据中创建 3D 可视化,其速度比传统方法快数百倍。该团队的研究发表在美国物理研究所的出版物《应用物理评论》上。
CDI 代表相干衍射成像,这是一种 X 射线技术,涉及从样品反射超亮 X 射线束。然后这些光束将被探测器收集为数据,并且需要一些计算工作才能将这些数据转换为图像。阿贡 X 射线科学部 (XSD) 计算 X 射线科学小组的负责人 Mathew Cherukara 解释说,部分挑战在于探测器只能从光束中捕获一些信息。
但是缺失的数据中包含重要信息,科学家们依靠计算机来填充这些信息。正如 Cherukara 所指出的,虽然这在 2D 中需要一些时间,但在 3D 图像中需要更长的时间。因此,解决方案是训练人工智能直接从原始数据中识别物体及其发生的微观变化,而无需填写缺失的信息。
为此,该团队从模拟 X 射线数据开始训练神经网络。框架标题中的 NN,神经网络是一系列算法,可以教会计算机根据接收到的数据预测结果。该论文的第一作者、美国能源部阿贡科学用户设施办公室纳米材料中心 (CNM) 的博士后研究员 Henry Chan 领导了这部分工作。
“我们使用计算机模拟来创建不同形状和大小的晶体,并将它们转换成图像和衍射图案供神经网络学习,”陈说。“快速生成许多用于训练的逼真晶体的容易性是模拟的好处。”
这项工作是使用阿贡系统评估联合实验室的图形处理单元资源完成的,该实验室部署了领先的测试平台,以支持对新兴高性能计算平台和功能的研究。
Argonne 材料科学部的物理学家兼小组负责人 Stephan Hruszkewycz 说,一旦网络经过训练,它就可以很快地接近正确答案。但是,仍有改进的余地,因此 3D-CDI-NN 框架包含一个过程,使网络完成其余部分。Hruszkewycz 与西北大学研究生 Saugat Kandel 一起致力于该项目的这一方面,从而减少了耗时的迭代步骤的需要。
Hruszkewycz 说:“材料科学部关心相干衍射,因为你可以看到几纳米长度尺度的材料——大约比人类头发的宽度小 100,000 倍——X 射线可以穿透环境。” “这篇论文展示了这些先进的方法,它极大地促进了成像过程。我们想知道一种材料是什么,以及它是如何随时间变化的,这将有助于我们在进行测量时制作更好的图片。 ”
作为最后一步,3D-CDI-NN 填充缺失信息和提出 3D 可视化的能力在 APS 的光束线 34-ID-C 收集的金微小颗粒的真实 X 射线数据上进行了测试。结果是一种计算方法在模拟数据上快了数百倍,在真实 APS 数据上几乎快了几百倍。测试还表明,网络可以用比通常需要的更少的数据来重建图像,以补偿检测器未捕获的信息。
Chan 表示,这项研究的下一步是将网络集成到 APS 的工作流程中,以便它在获取数据时从数据中学习。他说,如果网络从光束线上的数据中学习,它将不断改进。
对于这个团队,这项研究也有时间因素。正如 Cherukara 所指出的,APS 的大规模升级正在进行中,一旦项目完成,现在生成的数据量将呈指数级增长。升级后的 APS 将产生亮度高达 500 倍的 X 射线束,并且光束的相干性——光的特性,允许它以编码更多样本信息的方式衍射——将大大增加。
这意味着虽然现在从样本中收集相干衍射成像数据并获得图像需要两到三分钟的时间,但该过程的数据收集部分将很快提高 500 倍。将该数据转换为可用图像的过程也需要比现在快数百倍才能跟上。
“为了充分利用升级后的 APS 的功能,我们必须重新发明数据分析,”Cherukara 说。“我们目前的方法不足以跟上。机器学习可以充分利用并超越目前的可能性。”
除了 Chan、Cherukara 和 Hruszkewycz,该论文的作者还包括来自 Argonne 的 Subramanian Sankaranarayanan 和 Ross Harder;SLAC 国家加速器实验室的 Youssef Nashed;和西北大学的 Saugat Kandel。