与罗塞塔石碑上刻的文字不同,数字数据并非写在几乎不可改变的载体上。写出来几年后,其格式就会过时,读出分析工具无法在计算机上运行,可视化代码也不再起作用。但数据仍然可以包含有趣的科学信息,这些信息应该可以保留给未来的科学家使用。
一组可能引起极大兴趣的数据是LEP的数据,它是 CERN 的前旗舰加速器,在 2000 年之前用于对撞电子和正电子。与当前的 LHC 一样,LEP 有四个对撞点,每个对撞点都进行一项实验 - ALEPH、DELPHI、OPAL 和 L3 - 由数百名科学家操作。LEP 保持着世界上最高的 e+e- 能量对撞记录,但二十多年前收集的数据仍然只有一小部分人可以获取。
就像发掘古代文明遗迹的考古学家一样,数字考古学家是计算专家,他们在合作转向其他实验多年后检索数据。“第一步是在合作中就开放和共享数据以及利用数据所需的软件达成一致。然后,就像考古学家一样,我们深入研究以前的合作者编写的有关数据架构的文档,并检索用于实际分析的软件”,IT 部门的前 DELPHI 物理学家和计算专家 Ulrich Schwickerath 解释说。这不是一件容易的事,因为信息通常位于未发表的文档或私人存储库中,甚至可能未在合作中共享。
LEP 时期的分析软件存放在 CERNLIB 中,这是 CERN 开发的软件库,于 2003 年停用。“在 CERNLIB 的最新版本发布后不久,许多外部爱好者保留了它,并对软件进行了快速修复,即所谓的补丁。在社区的努力下,这些补丁被收集在一起,以创建一个社区版本,使旧软件能够适应现代架构,”Ulrich 解释道。“从那时起,我们与一些 LEP 爱好者一起,使用新的社区驱动版本的 CERNLIB 恢复了 DELPHI 和 OPAL 实验的软件堆栈。我们正在努力使数据集以原始格式完全可用,尽可能与现代硬件和软件工具兼容,并修改旧的可视化代码,以便今天的的科学家可以进行适当的分析。”