AlphaFold

来自医学百科

AlphaFold 是由 Google DeepMind 开发的人工智能系统,旨在根据氨基酸序列精准预测蛋白质的三维结构。2020 年,AlphaFold 2 在 CASP14 竞赛中取得了原子级精度的惊人成绩,被科学界公认为解决了困扰生物学 50 年的“蛋白质折叠问题”。2024 年发布的 AlphaFold 3 进一步引入了扩散模型(Diffusion Model),将预测范围扩展至蛋白质与 DNA、RNA、小分子配体及修饰离子的相互作用。这一技术彻底改变了结构生物学的研究范式,极大地加速了基于结构的药物设计(SBDD)和疾病机理研究。因其革命性贡献,核心研发者 Demis Hassabis 和 John Jumper 荣获 2024 年诺贝尔化学奖

AlphaFold
AI Protein Structure Prediction (点击展开)
结构生物学的“圣杯”
开发者 Google DeepMind
关键人物 Demis Hassabis, John Jumper
核心算法 Transformer, Evoformer, 扩散模型
里程碑 CASP14 夺冠 (2020)
数据库 AlphaFold DB (EBI 托管)
最高荣誉 2024 诺贝尔化学奖

技术演进:从 v2 到 v3

AlphaFold 的核心突破在于利用深度学习技术,从进化信息中提取空间几何约束。

版本 核心架构 (Architecture) 能力边界
AlphaFold 2
(2020)
Evoformer (进化转换器): 利用多序列比对 (MSA) 捕捉共进化信息,通过注意力机制处理氨基酸对之间的空间关系。 单体蛋白与多聚体: 极高精度的蛋白质骨架和侧链预测,主要针对蛋白质本身。
AlphaFold 3
(2024)
Pairformer + 扩散模型 (Diffusion): 减少了对 MSA 的依赖,引入生成式扩散模块直接生成原子坐标云。 生物分子复合物: 能预测蛋白-DNA/RNA、蛋白-配体(药物)、抗体-抗原复合物及共价修饰。

核心机制:Evoformer 与注意力

多序列比对 (MSA) 的力量

原理: 结构比序列更保守。
AlphaFold 首先在巨大的基因数据库中搜索与目标蛋白相似的序列,构建 MSA。如果两个氨基酸在进化过程中发生共变(例如,位置 A 的突变总是伴随着位置 B 的补偿性突变),则暗示这两个氨基酸在三维空间中靠得很近。

端到端预测 (End-to-End)

不同于以往的“分步拼接”方法,AlphaFold 是端到端的。它直接从序列输入到结构输出,中间通过 Structure Module 旋转和平移每个氨基酸残基(视为刚体),通过反复迭代(Recycling)来优化最终的能量状态,直至结构收敛。其输出包含一个置信度指标 pLDDT,用于衡量预测的局部准确性。

       AlphaFold网络架构简图

💊 医药研发应用

  • 不可成药靶点 (Undruggable Targets): 快速揭示缺乏晶体结构的潜在药物靶点的口袋特征。
  • 虚拟筛选 (Virtual Screening): 结合 AlphaFold 3,可以直接模拟小分子药物与蛋白质口袋的结合模式,大幅降低湿实验筛选成本。
  • 抗体设计: 预测抗体与抗原的结合界面,辅助生物大分子药物的优化。
       学术参考文献与权威点评
       

[1] Jumper J, Evans R, Pritzel A, et al. (2021). Highly accurate protein structure prediction with AlphaFold. Nature. 2021;596(7873):583-589.
[里程碑文献]:AlphaFold 2 的主论文,详细披露了模型架构,是引用率最高的 AI 生物学论文之一。

[2] Abramson J, et al. (2024). Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature. 2024;630:493–500.
[最新突破]:介绍了 AlphaFold 3,展示了其在预测蛋白质与 DNA、RNA 及小分子配体复合物结构方面的超越性能力。

[3] Callaway E. (2020). 'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures. Nature News. 2020;588:203-204.
[新闻评论]:报道了 CASP14 的结果,标志着蛋白质结构预测问题在某种程度上被“解决”。

           AlphaFold · 知识图谱
竞品/相关 RoseTTAFold (David Baker) • ESMFold (Meta) • OmegaFold
基础理论 安芬森法则深度学习共进化分析
验证方法 X射线晶体学冷冻电镜 (Cryo-EM) • CASP竞赛
核心影响 将生物学带入“结构基因组学”时代 (Structural Genomics)