目 录CONTENT

文章目录

AlphaFold的下一步:与谷歌DeepMind诺贝尔奖得主对话

Administrator
2025-11-25 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.technologyreview.com/2025/11/24/1128322/whats-next-for-alphafold-a-conversation-with-a-google-deepmind-nobel-laureate/

原文作者:Will Douglas Heaven


在2017年,约翰·詹珀(John Jumper)刚完成理论化学博士学位,便听说谷歌DeepMind已经放弃了构建超人级别游戏AI的工作,开始了一个秘密项目来预测蛋白质结构。于是他申请了职位。

仅仅三年后,詹珀就庆祝了一项出人意料的辉煌胜利。他与首席执行官戴米斯·哈萨比斯(Demis Hassabis)共同领导开发了一个名为AlphaFold 2的AI系统,该系统能够以原子级别的精度预测蛋白质结构,其准确性与实验室中费时的技术相媲美,但速度却快得多——只需数小时而非数月就能返回结果。

AlphaFold 2解决了生物学中一个长达50年的重大挑战。哈萨比斯几年前告诉我:“这是我投身DeepMind的原因。”“事实上,这也是我整个AI职业生涯努力的方向。” 2024年,詹珀和哈萨比斯共同获得了诺贝尔化学奖

AlphaFold 2首次亮相至今已满五年。现在炒作已经平息,AlphaFold真正产生了什么影响?科学家们是如何使用它的?下一步又是什么?我与詹珀(以及其他几位科学家)进行了交谈,以了解情况。

詹珀笑着说:“这五年真是太不平凡了:‘很难回忆起我认识无数记者的日子之前是什么样的了。’”

AlphaFold 2之后是AlphaFold Multimer,它可以预测包含多个蛋白质的结构,然后是迄今为止最快的版本AlphaFold 3。谷歌DeepMind还将AlphaFold应用于UniProt,这是一个被全球数百万研究人员使用和更新的庞大蛋白质数据库。它现在已经预测了约2亿种蛋白质的结构,几乎涵盖了科学界已知的全部。

尽管取得了成功,詹珀对AlphaFold的成就仍保持谦虚。“这并不意味着我们对其中的一切都了如指掌,”他说。“这是一个预测数据库,它带有所有预测的注意事项。”

一个难题

蛋白质是构成生命活动的生物机器。它们形成肌肉、角和羽毛;它们在体内输送氧气,并在细胞间传递信息;它们激发神经元,消化食物,驱动免疫系统,等等。但要确切了解一个蛋白质的作用(以及它在各种疾病或治疗中可能扮演的角色),就需要弄清楚其结构——而这很难。

蛋白质由氨基酸链组成,这些氨基酸链在化学力的作用下扭曲成复杂的结。一个未扭曲的链条很少能提供关于其将形成的结构的线索。理论上,大多数蛋白质可以采取天文数字般的可能形状。任务是预测出正确的那个。

詹珀和他的团队使用一种称为Transformer的神经网络来构建AlphaFold 2,这与支撑大型语言模型(LLM)的技术相同。Transformer非常擅长关注一个更大谜题中的特定部分。

但詹珀将很多成功归功于他们能够快速测试的原型模型。“我们得到了一个能以惊人速度给出错误答案的系统,”他说。“这使得我们很容易开始对尝试的想法变得非常大胆。”

他们将神经网络塞满了尽可能多的蛋白质结构信息,例如某些物种的蛋白质如何演化出相似的形状。它的效果甚至比他们预期的还要好。“我们确信我们取得了突破,”詹珀说。“我们确信这是一个思想上的巨大进步。”

他没有预料到的是,研究人员会立即下载他的软件并开始将其用于如此多的不同事情。通常,只有经过几代迭代、问题解决后,才会有真正的影响,他说:“我对我所看到的科学家们使用它的负责任程度感到惊讶,他们在解释和实际使用方面都掌握得恰到好处,既不过度相信,也不过少信任。”

有没有特别突出的项目?

蜜蜂科学

詹珀提到了一个利用AlphaFold研究蜜蜂抗病性的研究小组。“他们在研究诸如蜂群崩溃等问题时,想要了解这种特定的蛋白质,”他说。“我从没想过,‘你知道,当然AlphaFold会被用于蜜蜂科学。’”

他还强调了他所称的AlphaFold的“非标签用途”(即“不保证有效”的用途),其中预测蛋白质结构的能力开辟了新的研究技术。“第一个非常明显的是蛋白质设计的进步,”他说。“戴维·贝克(David Baker)和其他人绝对抓住了这项技术。”

贝克是华盛顿大学的计算生物学家,是去年诺贝尔化学奖的共同获奖者之一,与詹珀和哈萨比斯一同获奖,因为他在创建合成蛋白质方面的工作,使其在治疗疾病或分解塑料等特定任务上比天然蛋白质更有效。

贝克和他的同事开发了自己的基于AlphaFold的工具,称为RoseTTAFold。但他们也试验了AlphaFold Multimer来预测他们设计的潜在合成蛋白质中哪些会起作用。

“基本上,如果AlphaFold自信地同意你试图设计的结构[然后]你制造了它,但如果AlphaFold说‘我不知道’,你就不会制造它。这本身就是一个巨大的进步。”詹珀说,这可以使设计过程快10倍。

詹珀强调的另一个非标签用途是:将AlphaFold变成一种搜索引擎。他提到有两个独立的研究小组试图确切了解人类精子如何与卵子在受精过程中结合。他们知道涉及的蛋白质之一,但不知道另一个:“所以他们拿了一个已知的卵蛋白,运行了所有2000个人类精子表面蛋白,他们发现有一个蛋白AlphaFold非常确定地与卵子结合。”然后他们能够在实验室中证实这一点。

“这种可以用AlphaFold做你以前做不到的事情——你不会为了寻找一个答案而去查看2000个结构,”他说。“我认为这种类型的应用非常出色。”

五年之后

当AlphaFold 2问世时,我采访了几位早期使用者,听取了他们的看法。评价很好,但这项技术太新了,无法确定其长期影响。五年后,我与其中一位受访者取得了联系,听取了他的想法。

克里门特·维尔巴(Kliment Verba)是加州大学旧金山分校(UCSF)的分子生物学家,负责一个实验室。“毫无疑问,这是一项非常实用的技术,”他告诉我。“我们每天、随时都在使用它。”

但它远非完美。许多科学家使用AlphaFold研究病原体或开发药物。这涉及到观察多个蛋白质之间,或蛋白质与体内更小分子之间的相互作用。但AlphaFold在预测多个蛋白质或它们随时间推移的相互作用方面准确性较低,这一点是众所周知的。

维尔巴说,他和他的同事使用AlphaFold的时间已经足够长,可以适应它的局限性。“在很多情况下,你得到一个预测,你不得不挠挠头,”他说。“这是真的还是假的?不是很清楚——它有点处于临界状态。”

“这和ChatGPT差不多,”他补充道。“你知道——它会以与给出真实答案同样的自信度来胡说八道。”

尽管如此,维尔巴的团队使用AlphaFold(2代和3代,因为它们各有优势)来在实验室运行实验之前先运行虚拟版本的实验。利用AlphaFold的结果,他们可以缩小实验的焦点——或者决定不进行该实验。

他说这真的可以节省时间:“它没有真正取代任何实验,但它确实大大增强了它们。”

新浪潮

AlphaFold的设计用途是广泛的。现在,多家初创公司和大学实验室正在利用它的成功来开发新一代更专注于药物发现的工具。今年,麻省理工学院(MIT)研究人员与AI制药公司Recursion合作,开发了一个名为Boltz-2的模型,该模型不仅可以预测蛋白质的结构,还可以预测潜在药物分子与其靶点结合的程度

上个月,初创公司Genesis Molecular AI发布了另一个结构预测模型Pearl,该公司声称对于药物开发中的某些查询,其准确性优于AlphaFold 3。Pearl是交互式的,因此药物开发人员可以将他们拥有的任何额外数据输入模型以指导其预测。

Genesis Molecular AI的首席执行官埃文·芬伯格(Evan Feinberg)表示,AlphaFold是一个巨大的飞跃,但还有更多工作要做:“我们仍在从根本上进行创新,只是拥有了一个比以前更好的起点。”

Genesis Molecular AI正在将误差范围从AlphaFold设定的、事实上的行业标准——不到两埃(Angstroms)——推向不到一埃,即百万分之一毫米,或单个氢原子的宽度。

该公司建模与模拟副总裁迈克尔·莱文(Michael LeVine)表示:“微小的错误对于预测药物实际结合靶点的效果可能是灾难性的。”因为在一个埃的尺度上起作用的化学力,在两个埃的尺度上可能就不起作用了。“它可能从‘它们永远不会相互作用’变为‘它们会相互作用’。”

鉴于该领域的活跃程度,我们应该多久才能看到新型药物上市?詹珀很务实。他表示,蛋白质结构预测只是众多步骤中的一个:“这不是生物学中唯一的问题。我们并非只差一个蛋白质结构就能治愈所有疾病。”

他接着说,可以这样想。以前,在实验室中确定一个蛋白质的结构可能需要花费10万美元:“如果我们离完成某件事只差十万美元,那早就做完了。”

与此同时,研究人员正在寻找利用这项技术做更多事情的方法,詹珀说:“我们正试图弄清楚如何使结构预测成为问题中更大的一部分,因为我们有一个不错的、巨大的锤子可以敲打它。”

换句话说,他们想把所有东西都变成钉子?“是的,让我们把东西变成钉子,”他说。“我们如何让这个我们加速了百万倍的东西成为我们流程中更大的一部分?”

下一步是什么?

詹珀的下一阶段是什么?他想将AlphaFold的深度但狭窄的能力与大型语言模型的广泛范围融合起来。

“我们有可以阅读科学的机器。它们可以进行一些科学推理,”他说。“我们可以构建出惊人的、超人的蛋白质结构预测系统。如何让这两种技术协同工作呢?”

这让我想起了谷歌DeepMind另一个团队正在构建的名为AlphaEvolve的系统。AlphaEvolve使用LLM生成问题的可能解决方案,并使用第二个模型进行检查,过滤掉垃圾。研究人员已经使用AlphaEvolve在数学和计算机科学中取得了一些实际发现。

这是否是詹珀所想的?“我不会透露太多关于方法的细节,但我会很惊讶如果看不到LLM对科学产生越来越多的影响,”他说。“我认为这是我几乎不会谈论的激动人心的开放性问题。当然,这一切都只是猜测。”

詹珀在获得诺贝尔奖时39岁。对他来说,下一步是什么?

“这让我很担心,”他说。“我相信我是75年来最年轻的化学奖得主。”

他补充说:“我职业生涯大概走了一半。我想我的方法是尝试做一些更小的、不断深入探索的小想法。我宣布的下一件事不必是我的第二次诺贝尔奖机会。我认为那是陷阱。”




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区