生物学变天:小扎的新开源模型,彻底掀翻谷歌AlphaFold王座

开源延迟引发学界怒潮,DeepMind终服软

今年5月,AlphaFold 3以Nature封面论文之姿惊艳亮相,号称能预测所有生物分子结构——从蛋白质到DNA、RNA乃至小分子配体。然而,谷歌DeepMind拒绝同时公开代码,仅提供有限的Web服务。这一“闭源发布”立即在生物信息学界引发巨大反弹:数十位顶尖科学家联名批评,认为这是对科研可重复性原则的背叛。六个月的舆论压力下,DeepMind终于在11月11日宣布全面开源,上传了完整的训练和推理代码,并附上详细的模型权重。这一“迟到的开源”虽来得有些晚,但足以点燃整个生物计算社区的热情。

深度学习架构碾碎蛋白质宇宙的最后壁垒

AlphaFold 3的核心革命在于其统一了分子动力学与深度学习的边界。它部署了经过特殊设计的神经网络——并非简单的CNN或Transformer,而是将“配对表征”与“多物种进化信息”深度融合。当输入一个氨基酸序列后,模型能直接输出原子级别的三维坐标,并且同时预测蛋白质与核酸、小分子间的相互作用界面。与AlphaFold 2相比,新模型在配体结合位点预测上的准确率提升了50%以上,彻底打破了传统分子对接方法的速度瓶颈。这意味着人类从此可以“通览”蛋白质宇宙中的所有分子交响。

生物学变天:小扎的新开源模型,彻底掀翻谷歌AlphaFold王座

拉斯克奖加冕,生物学正式进入AI时代

就在开源公告前不久,谷歌DeepMind因AlphaFold系列获得了2024年拉斯克基础医学研究奖——生理学和医学领域的最高荣誉之一。评委会在颁奖词中写道:“人工智能彻底改变了生物学的研究方式。”这一奖项与诺贝尔奖的级别相当,它认证了一个事实:蛋白质折叠这一困扰人类50年的“第二遗传密码”问题,已被AI彻底攻克。而AlphaFold 3的开源,更让全球数万家实验室无需依赖商业软件即可自由预测任意生物大分子结构,极大降低了结构生物学研究门槛。

从预测到设计:新模型如何重塑药物研发

以往的药物发现依赖X射线晶体学或冷冻电镜,一个靶点结构往往耗时数年。AlphaFold 3开源后,科研人员可以直接在本地部署完整管线。比如,输入新冠病毒刺突蛋白序列,几小时内就能生成包括糖基化修饰位点在内的全原子模型;接着用同一模型测试成百上千种候选小分子,计算结合自由能。这种“计算先行”的范式将新药研发的早期筛选速度提升了两个数量级。多家生物技术公司已经宣布将AlphaFold 3集成到自家的AI辅助药物设计平台中,彻底改变从靶点发现到先导化合物优化的全流程。

开源社区裂变,但谷歌王座上已现裂痕

虽然AlphaFold 3强势开源,但一个不容忽视的事实是:在它闭源的六个月里,Meta(扎克伯格旗下)的ESMFold、字节跳动的ProtMamba等开源模型已经凭借更小的参数量和更快的推理速度吸引了大量用户。小扎团队推出的ESM-3甚至支持“条件蛋白质生成”——输入特定功能要求,直接输出全新序列。这些后起之秀虽然绝对精度仍不及AlphaFold 3,但凭借开源、轻量化、可微调的优势,正在快速蚕食应用市场。这一次DeepMind被迫开源,恰恰说明在AI for Science的战场上,封闭王座已无法持久:谁更开放,谁才能赢得下一个时代。