CASP16冠军工具:MultiFOLD2/ModFOLDdock2精准预测蛋白质结构
CASP16冠军工具:MultiFOLD2/ModFOLDdock2精准预测蛋白质结构
未知变量解密蛋白质复合体:MultiFOLD2 与 ModFOLDdock2 双剑合璧
探明蛋白质复合物的精细结构,对于推动健康医疗、现代农业乃至生物工程等前沿领域取得突破性进展,扮演着至关重要的角色。可以说,理解这些生命大分子的复杂协作方式,是解开许多生命奥秘和攻克重大挑战的关键钥匙。
在此背景下,来自**雷丁大学(University of Reading)**的研究团队潜心研发,推出了两款强大的计算工具:MultiFOLD2 和 ModFOLDdock2。它们分别聚焦于蛋白质四级结构的精准预测和模型质量的可靠评估,为相关研究提供了得力的助手。
MultiFOLD2:更智能的蛋白质四级结构预测
MultiFOLD2 不仅仅是一个预测工具,它经过精心设计,具备了预测蛋白质复合物化学计量(即各组分比例)的能力。这一点在实际研究中尤其重要,因为往往在实验初期,复合物的具体组成是未知的。此外,研究团队还对 MultiFOLD2 的采样策略和评分机制进行了优化升级。这些改进使得 MultiFOLD2 在 CAMEO 等持续进行的独立基准测试中脱颖而出,展现了其强大的预测能力。
ModFOLDdock2:为模型质量提供可靠标尺
与 MultiFOLD2 相辅相成的是 ModFOLDdock2。它采用了一种巧妙的混合共识方法,能够对预测出的蛋白质四级结构模型生成全局和局部的质量评分。全局评分反映模型的整体可信度,而局部评分则聚焦于关键的相互作用界面区域,为研究者评估模型的细节提供了重要参考。
值得一提的是,ModFOLDdock2 不仅可以与 MultiFOLD2 无缝集成,构成一套完整的预测与评估流程,也可以作为一个独立的服务器使用。这意味着,研究人员可以利用 ModFOLDdock2 对任何来源的四级结构模型进行独立的质量检验,大大增强了其应用的灵活性。
这两款服务器都经历了独立且极为严格的评估检验,特别是在国际权威的 CASP16(蛋白质结构预测关键评估)实验中,它们均表现出卓越的性能,证明了其方法的有效性和先进性。
这项重要的研究成果,以《Prediction and quality assessment of protein quaternary structure models using the MultiFOLD2 and ModFOLDdock2 servers》为题,已于 2025 年 4 月 25 日发表在国际知名期刊《Nucleic Acids Research》上。
技术演进:从三级结构到四级结构的挑战
自从 AlphaFold2 在 CASP14 实验中取得里程碑式的成功,将蛋白质三级结构(单条肽链折叠)的预测精度提升至接近实验水平后,结构生物学领域的研究重心开始逐渐转向更为复杂的蛋白质四级结构(多条肽链组装成的复合体)的建模及其质量评估。
正是在这一趋势下,该研究团队自 CASP15 实验起,便将研发重点聚焦于此。他们早期开发了两个互补的服务器:
- MultiFOLD: 用于三级和四级结构预测。
- ModFOLDdock: 用于评估多聚体模型的精度。
本次发表的论文,正是对 MultiFOLD 和 ModFOLDdock 服务器进行重大更新后的成果介绍,详细阐述了 MultiFOLD2 和 ModFOLDdock2 的新功能,并报告了它们在最新的国际顶级独立基准评测 CASP16 和 CAMEO 中的实战表现。
图示:MultiFOLD 和 ModFOLDdock 工作流程(来源:论文)
MultiFOLD2 与 ModFOLDdock2 的核心创新与性能
MultiFOLD2 和 ModFOLDdock2 的实力,都经过了 CASP16 评估专家的独立检验。同时,MultiFOLD2 还持续接受 CAMEO 平台的评估。
CASP16 实验引入了一个重要的变化:多聚体靶标的分阶段发布。在第 0 阶段,由于靶标的化学计量信息(即复合体由哪些亚基以及各多少个组成)并未提供,服务器必须首先自行预测。同样,CAMEO 平台在提交靶标时通常也不提供化学计量信息。
针对这一挑战,MultiFOLD2 的核心创新之一便是显著增强了化学计量预测的稳健性。此外,它还:
- 优化了采样能力:集成了更多先进模型生成的结构,包括来自 AlphaFold2-Multimer(引入了 dropout 机制)、RoseTTAFold2 和 RoseTTAFold-All-Atom 的模型。
- 改进了模型评分:利用 ModFOLDdock2 对生成的众多模型进行更精准的打分和排序。
图示:MultiFOLD2 服务器针对 CASP16 目标 T0240 的结果页面。图中显示,它成功预测了正确的化学计量 A3。该页面同时支持移动和桌面浏览器访问。(来源:论文)
在 CAMEO 的持续基准测试中,MultiFOLD2 的整体表现甚至优于 AlphaFold3 (AF3)。而在要求更高的 CASP16 评测中:
- 根据 GDT_TS 评分(一种衡量模型与真实结构相似度的指标),MultiFOLD2 在中等和高难度靶标的预测中,位列所有服务器方法的第六名。
- 在难度极高的靶标领域,MultiFOLD2 更是勇夺第一。
- 在多聚体类别中,MultiFOLD2 表现超越了作为基准的 AlphaFold2 (ColabFold) 服务器。
- 根据官方的 lDDT 评分(另一种关注局部结构准确性的指标),MultiFOLD2 在 阶段 0(需要预测化学计量的阶段)的多聚体靶标上,表现优于 AF3。
ModFOLDdock2 服务器则专注于模型质量评估。其主要特点是采用混合共识方法,为预测的四级结构生成全局质量评分和局部界面残基的质量评分。相比于其前身 ModFOLDdock,ModFOLDdock2 的主要改进包括:
- 增加了新的评分项,以更全面地衡量模型质量。
- 引入了一个神经网络,专门用于预测局部区域(尤其是相互作用界面)的评分,提高了评估的精细度。
图示:MultiFOLD2 和 ModFOLDdock2 对异源多聚体 CASP16 靶标 H0225(阶段 0)/H1225(阶段 1)的预测示例,其化学计量为 A1B1C1。(来源:论文)
凭借出色的表现,ModFOLDdock2 在 CASP16 中荣获了四级结构模型全局评分和局部界面评分的双料第一。其不同变体在各项评估中均表现优异。基于此卓越成就,该研究团队已被邀请在 2024 年 12 月的 CASP16 大会上展示他们的方法。
开放共享,惠及全球科研
经过 CASP16 和 CAMEO 这样顶级平台的严格、独立的实战检验后,MultiFOLD2 和 ModFOLDdock2 的强大功能和可靠性得到了充分证明。
为了让这些先进的计算工具能够服务于更广泛的科研社区,研究团队为它们开发了直观易用的在线访问界面,并决定免费向所有人开放。这一举措无疑将为全球生命科学领域的研究人员提供宝贵的资源,助力他们在探索生命奥秘的征程上走得更远。
资源链接:






