DeepMind发布AlphaFold 3.5,蛋白质复合物预测精度再创新高
Google DeepMind于2026年1月28日正式发布AlphaFold 3.5版本,该版本在预测蛋白质与其他生物分子(如DNA、RNA、小分子配体)形成的复合物结构方面取得重大突破。据官方论文显示,在最新基准测试中,其对蛋白质-配体复合物的预测精度比AlphaFold 3提升约15%,对蛋白质-核酸复合物的预测精度提升约12%。这一进展有望极大加速药物发现和基础生物学研究。
🎯 核心内容
2026年1月28日,Google旗下AI研究机构DeepMind发布了AlphaFold系列的最新迭代版本——AlphaFold 3.5。自2024年AlphaFold 3发布以来,该模型已成为生命科学领域革命性的工具。此次3.5版本的核心升级在于显著提升了预测蛋白质与其他生物分子(统称为“生物分子复合物”)三维结构的准确性和可靠性。DeepMind团队在《自然》杂志上同步发表了相关论文,并开源了模型的部分核心组件。论文数据显示,在包含1287个蛋白质-小分子配体复合物的独立测试集上,AlphaFold 3.5的预测结果与实验测得的晶体结构之间的均方根偏差(RMSD)中位数降至1.2埃,而AlphaFold 3为1.4埃。对于更复杂的多亚基蛋白质与DNA/RNA的复合物,其预测精度也有显著提升。这一进步主要归功于模型架构的优化和训练数据的扩充。
🔬 技术细节
AlphaFold 3.5在技术层面延续了前代基于扩散模型和注意力机制的核心架构,但在多个关键模块进行了深度优化。首先,团队引入了更高效的“多尺度图表示”模块,能够更精细地刻画不同生物分子(蛋白质、核酸、配体)之间的相互作用力,如氢键、疏水作用和π-π堆积。其次,模型对训练数据进行了大规模扩充,新增了超过50万个来自PDB数据库的高质量生物分子复合物结构,以及通过分子动力学模拟生成的大量构象数据。在推理效率方面,团队优化了算法,使得预测一个中等复杂度(约500个残基)的蛋白质-配体复合物结构所需时间从AlphaFold 3的约10分钟缩短至6分钟左右。此外,模型还增强了对“构象变化”的预测能力,能够在一定程度上模拟蛋白质在与配体结合前后的动态变化,这对于理解药物作用机制至关重要。
💡 关键亮点
- 精度大幅提升:在关键测试集上,对蛋白质-配体复合物的预测精度提升15%,对蛋白质-核酸复合物提升12%,标志着AI在结构生物学领域的可靠性达到新高度。
- 覆盖范围更广:增强了对抗体-抗原、酶-抑制剂等具有重要医药价值的复合物类型的预测能力,并初步支持对某些翻译后修饰(如磷酸化)位点的结构影响评估。
- 效率与可及性:推理速度提升约40%,并通过DeepMind的服务器和部分开源代码,为全球学术研究者提供了更强大的免费研究工具。
🌍 行业影响
AlphaFold 3.5的发布再次巩固了DeepMind在AI for Science领域的领导地位。对于制药行业,这意味着早期药物发现(尤其是基于结构的药物设计)的成本和时间有望进一步压缩。分析师预测,未来3-5年,AI驱动的药物发现平台将更深度地整合类似AlphaFold的工具,将临床前候选化合物的发现周期平均缩短30%以上。同时,这也加剧了该领域的竞争,包括Meta的ESMFold、华盛顿大学的RoseTTAFold等团队必将加速追赶。此外,高精度的生物分子复合物预测能力,也将推动合成生物学、酶工程和生物制造等新兴领域的发展。
🔮 未来展望
DeepMind团队表示,下一步的研究重点将集中在预测更大、更复杂的生物分子组装体(如核糖体、病毒衣壳)的结构,以及模拟生物分子在细胞环境中的动态行为。长期目标是构建一个能够从基因序列出发,全面预测其编码产物在细胞中功能与相互作用的“数字细胞”模型。随着预测精度的提升,如何将AI预测的结构更无缝地对接下游的分子动力学模拟和自由能计算,以进行更精确的药物亲和力预测,将是产学研界共同攻关的方向。