X射线衍散射技术朝着高通量多维度进阶,使其成为同步辐射领域数据挑战最大的方法学之一。研究人员聚焦其传统物理解析方法复杂性高、时效性差的科学问题,利用全连接神经网络,高效准确地提取了二维衍射图像中隐藏的三维纤维取向分布信息(图1)。该方法以衍散射数据解析为切入点,建立了同步辐射机器学习在线数据解析的统一流程框架,并实现解析效率的万倍提速,为未来海量数据的在线处理奠定底层基础。该工作日前在国际晶体学TOP期刊《IUCrJ》在线发表(赵丽娜研究员、张一副研究员为通讯作者,博士生孙明辉、博士后董政为共同第一作者),中科院高能所是本工作的唯一通讯单位。
在高通量多维度海量数据的快速解析研究中,充分意识到高效数据采集、样品辐射损伤降噪的方法学研究重要性。因此,基于卷积神经网络,研究人员构建了一套专用于衍射与散射图像降噪的深度学习网络SEDCNN (Small Encoder-Decoder Convolutional Neural Networks),实现了低曝光时间衍射与散射图像的降噪(图2)。基于研究人员提出的方位角积分计算的降噪指标,该模型成功做到了训练速度与降噪结果稳定性远超现有SOTA模型。该工作日前在《npj Computational Materials》在线发表(董宇辉研究员为通讯作者,博士生周中正、博士后李纯为共同第一作者),中科院高能所是本文唯一通讯单位。
上述研究工作是在我所先后部署的“基于虚拟束线的自动化与智能化同步辐射实验数据采集软件研究(E25455U210,负责人:张一)”与“物理嵌入机器学习驱动高能同步辐射物质解析新发现(E35457U210,负责人:赵丽娜)”科技创新项目支持下开展完成,已初步形成人工智能在HEPS实验过程控制与数据采集、海量数据分析与信息挖掘应用研究的新模式。未来,在董宇辉研究员发表于Nature Reviews Physics期刊的“大型科学软件框架 + AI for Science”先进科研理念[3]指导下,HEPS光束线软件系统还将联合计算与网络通讯系统,进一步加强与线站科学家、人工智能领域专家的科研合作,共同解决HEPS的科学大数据挑战,推动科学大发现。
图1: 机器学习用于海量衍射图像高效分析
图2: SEDCNN网络架构与降噪效果