谷歌DeepMind发布AlphaFold 3.5,预测精度再创新高并开源关键组件
谷歌旗下DeepMind团队于12月11日宣布推出AlphaFold 3.5版本,这是其革命性蛋白质结构预测模型的重大升级。新版本不仅将蛋白质结构预测的准确度在关键指标上提升了15%,更重要的是,首次能够高精度预测蛋白质与DNA、RNA、小分子药物以及金属离子之间的复杂复合物结构。同时,DeepMind宣布将AlphaFold 3.5中用于预测蛋白质-小分子相互作用的核心模块开源,供全球科研人员免费使用。这一进展被业界誉为“通往动态细胞模拟的里程碑”,将极大加速新药研发和基础生命科学研究。
🎯 核心内容
2025年12月11日,谷歌DeepMind在《自然》杂志上发表论文,并同步发布了AlphaFold 3.5。自2020年AlphaFold 2解决蛋白质折叠问题以来,该系列模型一直是结构生物学的核心工具。AlphaFold 3.5的突破在于将其预测范围从静态的单一蛋白质,扩展到动态的、多组分的生物分子系统。例如,它可以预测一个转录因子蛋白如何精确地结合到DNA的特定序列上并引发弯曲,或者一个药物分子如何与病毒蛋白的活性口袋结合。DeepMind与欧洲分子生物学实验室(EMBL)合作,建立了一个包含超过2亿个预测结构的数据库,其中数千万个是新型的复合物结构。公司宣布,通过其合作伙伴Isomorphic Labs,已开始利用该平台进行实际的药物发现项目。
🔬 技术细节
AlphaFold 3.5在架构上进行了根本性革新。它采用了一种称为“等变扩散模型”的新方法,来生成分子系统的三维坐标。与之前主要基于注意力机制的模型不同,新方法能更好地处理分子间复杂的几何和物理约束。模型训练使用了包含数十万个通过冷冻电镜、X射线晶体学等实验解析出的高质量生物分子复合物结构数据集。在标准测试集CASP16上,其对蛋白质-小分子配体结合姿态的预测精度(RMSD)中位数达到1.2埃,远超之前的任何计算工具。对于蛋白质-DNA复合物,其预测界面残基的准确率超过85%。开源的核心模块是一个经过简化的、专注于蛋白质-配体结合的模型,参数约5亿,研究人员可在本地或Colab上轻松运行。
💡 关键亮点
- 全生物分子系统预测:首次用一个统一模型高精度预测蛋白质、核酸、小分子及修饰之间的相互作用网络。
- 精度飞跃:对复合物结构的预测精度接近部分实验方法的分辨率,足以用于指导药物化学优化。
- 战略级开源:在保留完整版商业权益的同时,开源最关键的子模块,既促进了科学共同体发展,也确立了行业技术标准。
🌍 行业影响
AlphaFold 3.5的发布将结构性计算生物学推向了新高度。对于制药行业,这意味着在药物发现早期即可虚拟筛选和优化数亿种潜在的药物-靶点结合模式,将临床前研发周期缩短数月甚至数年,成本降低数亿美元。生物科技公司如Recursion、Relay Therapeutics的股价在消息公布后应声上涨。同时,它也加剧了AI制药领域的竞争,例如,竞争对手如薛定谔(Schrödinger)、百图生科等公司必须加速其平台的迭代。在学术界,它将成为探索细胞内“分子社会”的基础工具,可能催生对信号通路、基因调控网络的全新理解。开源策略进一步巩固了DeepMind在该领域的领导地位,并吸引了全球开发者为其生态贡献力量。
🔮 未来展望
DeepMind团队的下一个宏伟目标是开发“AlphaFold Cell”,即模拟整个细胞或大型细胞器内所有分子相互作用的动态过程。这需要整合结构预测、分子动力学和系统生物学模型。预计在未来2-3年内,我们将看到能够预测突变如何影响复合物稳定性、以及如何设计全新蛋白质来执行特定化学反应的AI工具。开源模块的社区反馈将用于改进完整模型。此外,Isomorphic Labs计划在未来一年内,公布其基于AlphaFold 3.5平台发现的数个临床前候选药物,这将是该技术商业价值最直接的证明。