目 录CONTENT

文章目录

AlphaFold 改变了科学界:五年后,它仍在发展

Administrator
2025-12-24 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/alphafold-changed-science-after-5-years-its-still-evolving/

原文作者:Sandro Iannaccone


AlphaFold,由谷歌 DeepMind 开发的人工智能系统,刚刚迎来五岁生日。在过去的几年里,我们定期报道了它的成功;去年,它赢得了化学诺贝尔奖。

直到 2020 年 11 月 AlphaFold 首次亮相之前,DeepMind 最为人所知的是教会了人工智能在古老的围棋游戏中击败人类冠军。然后,它开始解决一个更严肃的问题,将其深度学习算法瞄准现代科学中最困难的问题之一:蛋白质折叠。结果是 AlphaFold2,一个能够以原子精度预测蛋白质三维形状的系统。

它的工作最终促成了一个数据库的建立,该数据库现在包含超过 2 亿个预测结构,基本上涵盖了整个已知蛋白质宇宙,被全球 190 个国家的近 350 万研究人员使用。2021 年发表在《自然》杂志上的描述该算法的文章迄今已被引用 40,000 次。去年,AlphaFold 3 到来,将人工智能的能力扩展到了 DNA、RNA 和药物。这种转变并非没有挑战——比如蛋白质无序区域的“结构幻觉”——但这标志着迈向未来的一步。

为了解 AlphaFold 的未来五年将如何发展,WIRED 采访了 DeepMind 研究副总裁兼 AI for Science 部门架构师 Pushmeet Kohli。

WIRED:Kohli 博士,五年前 AlphaFold 2 的问世被誉为生物学的“iPhone 时刻”。请谈谈从围棋等挑战到蛋白质折叠这一基础科学问题,您的角色在此转变中扮演了什么角色?

Pushmeet Kohli: 科学从第一天起就是我们使命的核心。Demis Hassabis 创立 Google DeepMind 的初衷就是认为人工智能将是加速科学发现的最好工具。游戏始终是一个测试平台,也是一种开发技术的方式,我们知道这些技术最终将解决现实世界中的问题。

我的角色主要是确定和追求人工智能可以产生变革性影响的科学问题,勾勒出取得进展所需关键要素,并组建一个多学科团队来应对这些宏大挑战。AlphaGo 证明了神经网络与规划和搜索相结合可以掌握极其复杂的系统。蛋白质折叠也具有这些特征。关键区别在于,解决这个问题将开启生物学和医学领域的发现,真正改善人们的生活。

我们专注于我称之为“根节点问题”的领域,即科学界一致认为解决方案将具有变革性,但常规方法在未来 5 到 10 年内无法实现突破的领域。把这想象成一棵知识之树——如果你解决了这些根节点问题,你就会开启全新的研究分支。蛋白质折叠绝对是其中之一。

展望未来,我认为有三个关键的机会领域:构建更强大的模型,使其能够像研究伙伴一样真正地进行推理和与科学家协作;将这些工具交到全球每一位科学家的手中;以及应对更大胆的抱负,例如创建第一个准确的人类细胞完整模拟。

我们来谈谈“幻觉”问题。您一再强调“驾驭”架构的重要性,即将一个具有创造性的生成模型与一个严格的验证器配对。随着 AlphaFold 3 开始使用本质上更具“想象力”且更容易产生幻觉的扩散模型,这种理念是如何演变的?

核心理念没有改变——我们仍然将创造性生成与严格验证相结合。演变的是我们将这一原则应用于更宏大问题的具体方式。

我们始终采取“问题优先”的方法。我们不会寻找可以插入现有技术的地方;我们会深入理解问题,然后构建解决问题所需的一切。转向 AlphaFold 3 中的扩散模型源于科学的需求:我们需要预测蛋白质、DNA、RNA 和小分子如何相互作用,而不仅仅是单个蛋白质结构。

您提出扩散模型更具生成性,因此存在幻觉问题,这是正确的。这使得验证变得更加关键。我们内置了置信度分数,用于指示预测可能不太可靠的情况,这对固有无序的蛋白质尤其重要。但真正验证这种方法的是,五年来,科学家们在实验室里一次又一次地测试了 AlphaFold 的预测。他们信任它,因为它在实践中确实有效。

您正在推出“AI 协同科学家”——一个基于 Gemini 2.0 构建的、能够生成和辩论假设的代理系统。这听起来像是“科学方法装箱”。我们是否正在走向一个“首席研究员”是人工智能、而人类仅仅是验证其实验的技术人员的未来?

我所看到的是科学家们花费时间的方式发生了转变。科学家们一直扮演着双重角色——思考需要解决什么问题,然后想出如何解决它。随着人工智能在“如何做”方面提供更多帮助,科学家将有更多自由专注于“做什么”,即哪些问题真正值得提出。人工智能可以加速找到解决方案,有时甚至相当自主,但决定哪些问题值得关注,在根本上仍然是人类的工作。

“协同科学家”的设计正是为了这种伙伴关系。它是一个使用 Gemini 2.0 构建的多代理系统,充当虚拟协作伙伴:识别研究空白、生成假设并提出实验方法。最近,帝国理工学院的研究人员在研究某些病毒如何劫持细菌时使用了它,这为应对抗菌素耐药性开辟了新的方向。但人类科学家设计了验证实验,并理解了其对全球健康的重要性。

关键在于正确理解这些工具,包括它们的优势和局限性。正是这种理解使得科学家能够负责任且有效地使用它们。

您能否分享一个具体的例子——也许来自您在药物再利用或细菌进化方面的工作——其中 AI 代理产生分歧,而这种分歧导致了比单独的人类工作更好的科学成果?

该系统的运行方式非常有趣。我们有多个 Gemini 模型充当不同的代理,它们生成想法,然后相互辩论和批评彼此的假设。这种内部的来回交流,探索证据的不同解释,旨在产生更精炼和更具创造性的研究提案。

例如,帝国理工学院的研究人员正在研究某些“海盗噬菌体”(劫持其他病毒的迷人病毒)如何突破细菌的防御。了解这些机制可以为应对耐药感染开辟全新的途径,这显然是一个巨大的全球健康挑战。

“协同科学家”为这项工作带来的能力是能够快速分析数十年的已发表研究,并独立得出一个关于细菌基因转移机制的假设,该假设与帝国理工团队花费数年时间通过实验开发和验证的结果相匹配。

我们真正看到的是,该系统可以极大地压缩假设生成阶段——快速综合海量文献——而人类研究人员仍然设计实验,并理解这些发现对患者的实际意义。

展望未来五年,除了蛋白质和材料,哪个“未解之谜”让您夜不能寐,而这些工具可以提供帮助?

真正让我兴奋的是理解细胞如何作为一个完整的系统运作——而破译基因组是实现这一点的基础。

DNA 是生命的菜谱,蛋白质是配料。如果我们能真正理解我们的基因差异以及 DNA 变化时会发生什么,我们将开启非凡的新可能性。不仅是个性化医疗,还可能设计新的酶来应对气候变化以及超出医疗保健范围的其他应用。

诚然,模拟整个细胞是生物学的重大目标之一,但这仍然有很长的路要走。作为第一步,我们需要了解细胞的最内在结构,即细胞核:准确了解基因组的哪一部分何时被读取,产生最终导致蛋白质组装的信号分子是如何产生的。一旦我们探索了细胞核,我们就可以从内部向外推进。我们正在朝着这个目标努力,但这还需要几年时间。

如果我们能可靠地模拟细胞,我们可以彻底改变医学和生物学。我们可以在合成之前在计算上测试候选药物,从根本上理解疾病机制,并设计个性化疗法。这正是您所问的生物学模拟与临床现实之间的桥梁——将计算预测转化为真正帮助患者的实际疗法。

本文最初发表于 WIRED Italia,并已从意大利语翻译过来。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区