目 录CONTENT

文章目录

AI时代下的生物安全新挑战:探秘“释义项目”如何构建更具韧性的生物防御体系

Administrator
2025-10-13 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.microsoft.com/en-us/research/podcast/ideas-more-ai-resilient-biosecurity-with-the-paraphrase-project/

原文作者:Microsoft Research (Ideas Podcast)


《思想者》播客:利用“释义项目”构建更具AI韧性的生物安全体系

在每项新兴技术背后,都有一个伟大的思想在推动其发展。在微软研究院的《思想者》(Ideas)播客系列中,微软的研究人员深入探讨了驱动他们研究的信念、启发他们的经验和思想,以及他们所追求的积极的人类影响。

人工智能(AI)被描述为一种“双刃剑”技术:其能够带来益处的能力,也可能被用于造成伤害。在本期节目中,微软首席科学官埃里克·霍维茨(Eric Horvitz)和他的嘉宾——微软高级应用科学家布鲁斯·维特曼(Bruce Wittmann)、国际生物安全与生物安全科学倡议组织(IBBIS)技术负责人特莎·亚历山尼安(Tessa Alexanian),以及Twist Bioscience公司副总裁詹姆斯·迪根斯(James Diggans)——探讨了AI在蛋白质设计领域的这一双重影响。

在霍维茨的引导下,亚历山尼安、迪根斯和维特曼组成了一个跨部门团队,他们展示了利用AI设计有毒蛋白质候选物,并绕过现有防御系统的可能性。这项被称为“释义项目”(Paraphrase Project)的工作,最终催生了一项网络安全式的响应措施、一个更强大的蛋白质筛选系统,以及对同行评审方法的修改,这些都对我们更广泛地思考和应对AI风险具有深远意义。这项研究的成果最近发表在《科学》(Science)杂志上。


深入了解相关研究:

订阅《微软研究院思想者》播客:

文字记录

[音乐]

埃里克·霍维茨:您正在收听的是《思想者》,一个深入探索技术研究以及代码背后深刻问题的微软研究院播客。我是埃里克·霍维茨,微软的首席科学官。在本系列中,我们将探讨塑造我们未来的技术以及推动它们发展的重大思想。

[音乐淡出]

今天,我很高兴能与大家谈论“释义项目”——这项我共同领导的工作,旨在探索AI在蛋白质设计方面的进步可能如何影响生物安全。研究结果发表在我们最近于10月2日发表在《科学》杂志上的论文《针对生成式蛋白质设计工具的核酸生物安全筛选加固》中。

与我一起的还有该论文的几位主要合作者:微软高级应用科学家布鲁斯·维特曼;Twist Bioscience公司副总裁、国际基因合成联盟(IGSC)董事会主席詹姆斯·迪根斯;以及国际生物安全与生物安全科学倡议组织(IBBIS)的技术负责人特莎·亚历山尼安。

现在,让我们回溯两年。几乎在同一天,布鲁斯和我发现了一个漏洞。在为一次关于AI与生物安全的研讨会准备案例研究时,我们发现开源的AI蛋白质设计工具可以被用来重新设计有毒蛋白质,其方式可能绕过生物安全筛选系统——这些系统旨在识别令人担忧的合成订单。

在那项工作中,我们利用开源工具创建了一个AI流程,可以有效地对氨基酸序列进行“释义”(paraphrase)——即在努力保持其结构和潜在功能的同时,重新构建它们。

这些“释义后”的序列能够避开主要DNA合成公司使用的筛选系统,而这些系统是科学家依赖于安全地生产AI设计蛋白质的基础。

该领域的专家将这一发现描述为AI与生物安全领域的第一个“零日漏洞”。这也标志着一项深入的、为期两年的协作努力的开始,旨在调查和解决这一挑战。

在强大的跨部门团队(包括詹姆斯、特莎、布鲁斯以及其他许多人)的帮助下,我们在幕后致力于构建AI生物安全“红队测试方法”,探查漏洞,并设计实用的修复方案。这些“补丁”——类似于网络安全中的补丁——现已与全球组织共享,以加强生物安全筛选。

这是我曾有幸参与过的最引人入胜的项目之一,因为它涉及技术复杂性、伦理和政策层面,以及跨行业、政府和非营利部门的非凡协作。

该项目突出表明,那些有能力带来巨大益处的AI工具,也可能被滥用,这要求我们保持警惕、深思熟虑和富有创造力,以便我们继续从AI工具中获取最大利益,同时努力确保我们避免代价高昂的误用。

话不多说,请允许我正式欢迎我们的嘉宾。

布鲁斯、詹姆斯、特莎,欢迎来到播客。

布鲁斯·维特曼:谢谢你,埃里克。

詹姆斯·迪根斯:感谢邀请我们。

霍维茨:与你们每一个人密切合作是一次愉快的经历,不仅因为你们的专业知识,也因为你们对公共健康和全球安全的深刻承诺与热情。

在深入技术层面之前,我想请各位谈谈,你们是如何进入这个领域的?是什么激励你们成为生物学家,然后又去关注AI进步对生物安全的影响?布鲁斯?

维特曼:嗯,我一直喜欢建造东西。我想这是我的出发点。你知道,埃里克,当我不在研究生物学或AI相关事情的时候,我的业余爱好就是在家里做些建筑工作,对吧?做些施工之类的。

但我更广泛的兴趣一直以来都是生物学和化学。所以最初我进入了有机化学领域。我发现那非常迷人。从那里,我转向了合成生物学,特别是代谢工程,因为这有点像有机化学,但你连接的是生物体代谢的不同部分,而不是不同的化学反应。当我在那个领域工作时,我有点想,‘肯定有更简单的方法来做这件事’[笑声],因为做任何类型的代谢工程都非常困难。这就是我进入AI领域的原因,试图解决这些非常复杂的生物学问题,试图利用我们从数据中获得的理解,或者数据中推导出理解,来构建我们甚至不一定完全理解的东西。

所以,你知道,这就是我到达现在的迂回方式——我到达现在这个位置的抽象方式。

霍维茨:那么,特莎,是什么激励你投身于这个领域,聚焦于生物学和生物科学,并帮助我们避免灾难性的后果呢?

亚历山尼安:是的,我之所以对生物学感到兴奋的根源,其实是一本名为《细胞的生命》(The Lives of a Cell)的书,作者是刘易斯·托马斯(Lewis Thomas)。这是一本极其优美的散文集,让我觉得,“哇,生命真是太不可思议了。” 我想我在12或13岁时读了它,我想,“生命是不可思议的。我想投身于此。这是最美的科学。” 对吧?然后在大学里,我学习工程学,听说有一个工程团队是做生物工程的——就是这个iGEM团队——我就加入了,心想,“哦,这太酷了。我真的要投身于合成生物学这个领域。”

然后我也尝试了湿实验生物学,我说,“哦,但我讨厌这部分。我其实并不喜欢……‘保姆式’地照看微生物。”[笑声] 我认为有些……有些优秀的湿实验生物学家是带着非常坚韧的品质造就的。他们真的很喜欢弄清楚如何重新设计他们的阴性对照,以便他们能判断出来是污染还是温度波动造成的。显然,我不是那样的人。

所以我最终成为了一个实验室自动化工程师,因为我可以帮助科学发生,但……但我的职责是机器人和计算机,而不是微生物,我觉得微生物有点难以驯服。

霍维茨:对。我在想那些坚韧的人,他们过去也用嘴巴吸取这些被污染的液体进行移液操作……

维特曼:现在不会了。 亚历山尼安:没错。[笑声]

迪根斯:现在不会了。[笑声]

亚历山尼安:他们过去更坚韧。

霍维茨:詹姆斯。

迪根斯:所以我的本科专业是计算机科学和微生物学,主要是因为当时我无法在两者中选择我更喜欢哪一个。我两个都喜欢。等到我毕业时,我很幸运地意识到,两者的交集可以成为一件事。所以我获得了计算生物学博士学位,然后在麻省理工学院(MITRE)公司工作了五年。这是一家非营利组织。我获得了与美国生物防御社区合作的机会,并了解到了保护部队和广大民众免受生物威胁的优秀人群,并学习了大量的生物学知识以及双重用途风险。所以,当Twist公司打电话给我,问我是否愿意加入Twist并建立他们的生物安全项目时,我抓住了机会,在过去10年里一直致力于此。

霍维茨:好的,非常感谢各位。

我相信,特别是AI驱动的蛋白质设计,是现代科学最令人兴奋的前沿之一。它为医学、公共卫生乃至材料科学的突破带来了希望。我们已经看到它促成了新疫苗、新型疗法,并在科学层面上,对生命机制的强大洞察。

因此,未来还有更多进展,尤其是在AI如何帮助我们促进健康、长寿和疾病预防方面。但在我们走得太远之前,虽然我们的一些听众在生物科学领域工作,但许多人可能对一些基础知识了解不多。

所以,布鲁斯,你能给我们一个关于蛋白质的高层次概述吗?它们是什么?它们为什么重要?它们如何融入人类设计应用中?

维特曼:当然。是的。很幸运,我过去曾担任过“AI蛋白质设计”课程的助教,所以这正是我擅长的领域。[笑声]

霍维茨:太完美了,完美的背景。[笑声]

维特曼:非常完美。是的。我得以回顾所有这些知识。是的,从最基本的层面来说,蛋白质是生命的“劳力马”。

我们体内发生的每一种化学反应——好吧,我们体内发生的几乎每一种化学反应——我们细胞的大部分结构,你都知道。任何生命过程,蛋白质都处于核心地位。

现在,蛋白质由所谓的……好吧,我不应该说“编码”。它们是由被称为氨基酸的物质构建而成的——有20种——根据你连接这些氨基酸的组合和顺序,你会得到不同的蛋白质序列。所以这就是我们所说的蛋白质序列的含义。

蛋白质的序列决定了它在细胞中折叠成什么形状,而那个形状决定了蛋白质的作用。所以我们常说,序列决定结构,结构决定功能。

现在我们在蛋白质工程中面临的挑战是,可能性究竟有多少。在实际应用中,它是无限的。所以我们有20个构建模块。一个蛋白质平均有大约300个氨基酸。所以这意味着有$20^{300}$种可能的组合。一个常见的参考点是,据估计,可观测宇宙中大约有$10^{80}$个粒子。所以可能的组合数量是天文数字,而蛋白质工程师的工作就是在这片潜在的蛋白质空间中找到一个或少数几个能完成我们期望任务的蛋白质。

因此,当人类有了“好吧,我希望蛋白质能做这个”的想法时,我们有各种技术来寻找期望的蛋白质,其中一种就是使用人工智能,试图在潜在蛋白质的这片海洋中进行筛选,或者,正如我们将在本次播客中更多讨论的,进行物理生成。也就是以一种方式创造它们,从合理的蛋白质分布中采样。

霍维茨:太棒了。所以我想把问题转给詹姆斯,让他谈谈蛋白质设计如何从计算机变为现实——从计算机(in silico)到试管中。Twist Bioscience公司在将数字蛋白质设计转化为合成蛋白质方面扮演什么角色?也许我们也可以谈谈贵公司采取了哪些保障措施,以及为什么我们需要这些措施。

迪根斯:所以,布鲁斯描述的所有这些蛋白质都是由DNA编码的。因此,我们的细胞用来存储如何制造这些蛋白质信息的语言全部都编码在DNA中。因此,如果你作为一个工程师设计了一个蛋白质,你想测试它是否如你所想的那样起作用,第一步就是需要制造出编码该蛋白质的DNA,而Twist这样的公司就承担了这一角色。

然而,我们也意识到,这些是…… [内容被截断]




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。

青云聚合API官网https://api.qingyuntop.top

支持全球最新300+模型:https://api.qingyuntop.top/pricing

详细的调用教程及文档:https://api.qingyuntop.top/about

0

评论区