AI融合物理学:抗体抗原结构预测新突破
AI融合物理学:抗体抗原结构预测新突破
未知变量AI 与物理学联手:抗体-抗原复合物结构预测的新探索
在生物医学的广阔领域中,精准预测抗体-抗原复合物的三维结构,其重要性不言而喻。这不仅是我们深入洞察免疫系统如何响应病原体入侵、揭示免疫应答精妙机制的钥匙,更是设计和优化治疗性抗体——这类被誉为“生物导弹”的药物——的基石。然而,要想达到原子级别的精确度,目前的技术手段依然面临着不小的挑战,各种预测模型得出的结果也常常伴随着一定程度的不确定性。
现有方法的局限性
近年来,深度学习的浪潮席卷了生命科学领域,其中,AlphaFold的横空出世无疑为蛋白质结构预测带来了革命性的突破。它在预测单一蛋白质或常规蛋白质复合物结构方面展现了惊人的准确性。但令人稍感遗憾的是,当AlphaFold面对更为复杂的抗体-抗原相互作用时,其预测成功率却不尽如人意。究其原因,主要是因为抗体与抗原之间往往缺乏如蛋白质家族内部那样强烈的协同进化(co-evolutionary)信号——这是AlphaFold赖以进行精确预测的关键信息之一。
另一方面,传统的基于物理学的分子对接工具,作为另一种预测复合物结构的途径,虽然在某些情况下能够提供有价值的参考,但它们普遍存在一个核心短板:难以有效模拟蛋白质骨架的柔性。我们知道,蛋白质在结合过程中并非僵硬的积木,而是会发生构象调整。这种对柔性的模拟不足,极大地限制了传统对接方法的准确性和普适性。
这种对柔性处理的不足,在抗体的互补决定区(Complementarity-Determining Regions, CDRs)表现得尤为明显。CDRs,特别是其中构象最具多样性和可变性的CDR-H3环,是抗体识别并结合抗原的“关键之手”。它们的构象灵活性对抗原的特异性识别至关重要,而这恰恰是传统对接方法难以准确捕捉的。
“AI 增强的物理对接”:一种新思路
面对上述挑战,来自加拿大国家研究委员会 (NRC) 人类健康治疗小组的研究团队独辟蹊径,提出了一种名为“AI 增强的物理对接”(AI-enhanced physical docking)的新策略。该策略的核心思想巧妙地结合了AI与物理对接的优势:
- 首先,利用AI引导的抗体建模工具(如IgFold, ABodyBuilder2, EquiFold等)生成一个包含多种CDR构象的抗体结构集合(ensemble)。这样做的好处是能够更全面地捕捉CDR区域,尤其是CDR-H3环的构象多样性。
- 然后,将这个多样化的抗体结构集合整合到基于AlphaFold2的重新评分对接流程中。这意味着,对接产生的候选复合物结构会经过AlphaFold2的“慧眼”进行二次评估和筛选,以期提高预测的准确性。
这项研究的详细内容已发表在 Bioinformatics 期刊上:
https://academic.oup.com/bioinformatics/article/41/4/btaf129/8093612?login=false
研究方法概览
为了验证新策略的有效性,研究团队进行了一系列精心的实验设计:
- 数据来源:他们从SAbDab数据库(一个专门收集抗体结构信息的数据库)中获取了已知的抗体-抗原复合物晶体结构作为基准。
- 抗体模型生成:利用多种先进的AI抗体建模工具,包括IgFold、ABodyBuilder2和EquiFold,来生成抗体的初始三维结构模型。
- 抗原模型处理:抗原模型则是通过从已知的复合物晶体结构中“刚性解离”(rigidly dissociated)出来得到的。为了更贴近真实的未结合(unbound)状态,他们还使用了SCWRL4软件对解离出的抗原侧链构象进行轻微扰动。
- 复合物对接与比较:随后,研究人员采用成熟的蛋白质-蛋白质分子对接软件来预测抗体与抗原的结合模式,并将这种新方法的对接性能与当前顶尖的蛋白质结构预测方法AlphaFold以及另一知名方法Boltz-1进行了横向比较。
图示:由IgFold、ABodyBuilder2和EquiFold等AI工具预测生成的抗体结构集合,展现了CDR区域,特别是CDR-H3环的构象多样性。(图片来源:原论文)
结果与讨论:新策略的潜力与边界
在评估不同预测工具的性能时,一个不容忽视的现实是:客观比较那些工作流程和输入要求截然不同的工具本身就充满挑战。例如,深度学习工具(如AlphaFold)通常从氨基酸序列数据直接预测结构,而传统的对接工具则需要研究者提供至少一个(通常是两个)已知或预先建模的蛋白质结构作为输入。这种根本性的差异使得“苹果对苹果”的比较变得困难。
研究结果清晰地表明,对接成功率与输入抗体模型的质量密切相关。当AI生成的抗体模型在结构上与真实的结合状态(bound state)更为接近时,物理对接预测的成功率便会得到显著提升。这凸显了高质量初始模型对于后续对接准确性的关键作用。
在直接使用晶体结构来源的抗原进行的模拟对接实验中,“AI增强的物理对接”策略相较于单独使用AlphaFold2(在抗体-抗原复合物预测方面)展现出了明显优势。与另一款对接工具Boltz-1相比,新策略也取得了一定的性能改进,尽管改进幅度相对温和。
然而,研究团队也坦诚地指出,一个无法回避的现实是,AlphaFold3的问世再次刷新了蛋白质结构预测的 SOTA (State-of-the-Art)。无论是用于表位作图(epitope mapping)还是更具挑战性的从头抗体设计(de novo antibody design),目前包括“AI增强的物理对接”在内的物理对接方法,在整体性能上仍然显著落后于最新的AlphaFold3。
这意味着,随着AlphaFold3等更强大AI工具的出现,传统物理对接方法的适用场景确实受到了进一步的挤压。研究团队审慎地认为,物理对接策略(包括他们提出的新方法)目前更适用于那些我们能够通过AI或其他手段生成高置信度、高质量抗体(或抗原)单体模型的情况。在这些情况下,物理对接可以作为一种有益的补充或验证手段。否则,当对预测精度有极高要求或缺乏高质量单体结构信息时,直接采用如AlphaFold3这样更为精准的端到端AI复合物预测技术,可能是更为明智的选择。





