摄影:Yulia Pozdnyakova“西伯利亚的科学”
近日,SKIF集体使用中心的科学家在病毒蛋白质结构研究领域取得了重要进展。他们成功确定了最近在中国和日本发现的三种由蜱虫携带的病毒的多种蛋白质的空间结构。这些病毒可导致人类出现发烧、血液中血小板和白细胞水平下降以及肝功能障碍等症状。
科学家利用先进的程序,将这些病毒蛋白质结构的实验数据与神经网络预测的模型进行了比较,从而大大加速了从预测结构中选择目标候选物的过程。这一突破性的方法不仅使我们能够更深入地了解这些病毒的生命周期,还为开发有效药物和疫苗提供了有力支持。
SKIF集体使用中心的科学家开发的这一程序,具有显著的优势。它能够在几分钟内处理神经网络预测的大量变体,使得蛋白质结构验证的过程加快数百倍。这一计划将向所有研究人员免费开放,无疑将为全球病毒学和药物研发领域带来重大利好。
蛋白质结构的确定对于理解生物体的功能、疾病发展的机制以及研制有效的药物和疫苗至关重要。然而,这一过程往往漫长、耗费人力且昂贵。传统的X射线结构分析需要生长晶体,但并非所有蛋白质都能满足这一条件。而小角度X射线散射(SAXS)方法则可以在溶液中研究蛋白质并获得其大致形状,为蛋白质结构研究提供了新的途径。
近年来,机器学习在模拟蛋白质空间结构方面发挥了积极作用。2024年,诺贝尔化学奖授予了AlphaFold2神经网络的开发者,该网络能够根据蛋白质的氨基酸序列预测其三维结构。然而,使用这种神经网络仍然需要获得每个氨基酸序列的许多三维结构变体,并通过实验进行验证。
为了将神经网络预测的结构与SAXS实验的数据进行比较,SKIF集体使用中心的科学家开发了新的程序。该程序能够将神经网络预测的结构转换成与SAXS实验中获得的相同格式,从而方便科学家进行比较和选择。通过这一方法,科学家成功预测了一组蛋白质的三级结构,并获得了关于这些病毒蛋白质的重要数据。
据该程序的作者、SKIF集体使用中心的员工Anton Vedkal介绍,蛋白质具有多种多样的形状,而所开发的程序正是为了将这些不同形状的蛋白质结构进行转换和比较,以选择最可能的结构。
科学家还利用上海同步辐射装置(SSRF)的SAXS方法确定了这些病毒蛋白质分子的形状,并结合AlphaFold、RoseTTAFold、Chain-1三个神经网络对蛋白质结构变体进行了预测。尽管候选序列数量超过百个,且AI模块得出的结果需要通过其他方法进行确认,但利用开发的程序,科学家成功将结构转换为SAXS曲线,实现了实验数据与预测结构的比较。