近期,DESY(德国电子同步加速器研究中心)和汉堡大学的科学家团队就针对操作加速器提出了这样的问题,并惊讶地发现ChatGPT等“大型语言模型”(LLM)能够帮助他们运行这些复杂的科学机器。这一研究成果已于近日在《科学进展》杂志上发表。
Ein humanoider NA 人形 Nao 机器人参观 ARES 粒子加速器的隧道(象征性照片)。照片:DESY,Jan Kaiserao-机器人在 ARES-Teilchenbeschleunigers 隧道中。符号照片)。照片:DESY,Jan Kaiser
在物理学领域,机器学习已被广泛应用于自动执行某些例行程序和任务。特别是在加速器物理学中,实时调整粒子加速器以确保其始终保持最佳性能是一个极具吸引力的应用领域。由DESY科学家Jan Kaiser领导的研究小组展示了如何使用一种特殊的机器学习技术——即LLM,来实现这一目标。
LLM是ChatGPT等流行聊天机器人背后的技术,它们经过大量数据的训练,能够识别、解释和生成人类语言。该团队试验了14种不同的LLM,并用它们来控制DESY的实验电子加速器ARES。他们的目标是调整五块磁铁,使ARES的电子束能够以最佳方式聚焦和引导。
与以往不同的是,科学家们并没有通过编程来定义LLM的具体需求,而是使用自然语言提示向LLM描述了问题。随后,LLM建议了如何以最高精度设置五个调整参数,并解释了每个参数值将实现的效果。
Jan Kaiser表示:“我们对一些LLM能够如此出色地解决问题感到非常惊讶。但更令人着迷的是,它们甚至不需要知道它们正在操作粒子加速器。因此,从理论上讲,LLM可以解决任何类型的优化问题,这意味着我们的方法远远超出了加速器物理领域。”
然而,在概念验证调查中,研究人员也遇到了一些挑战。Annika Eichler(DESY和汉堡工业大学)指出:“就像人类操作员一样,你必须向正确的LLM提出正确的问题才能得到好的解决方案。”此外,解决此类问题的计算能力以及对环境的影响目前仍是巨大的挑战,这些系统仍然落后于其他专门方法。
就目前而言,LLM可能更适合在加速器控制室担任“副驾驶”,为操作员提供咨询建议。然而,Eichler认为:“我们的工作是迈向未来的重要第一步。在未来,人们只需使用自然语言询问所需的结果,就可以操作复杂且高度相关的科学设施。”