目 录CONTENT

文章目录

人工智能的黑客技能正逼近“拐点”

Administrator
2026-01-15 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/ai-models-hacking-inflection-point/

原文作者:Will Knight


网络安全初创公司RunSybil的联合创始人Vlad Ionescu和Ariel Herbert-Voss,在上个月收到他们的人工智能工具Sybil发出的警报时,感到一瞬间的困惑。

Sybil使用多种不同的AI模型——以及一些专有的技术诀窍——来扫描计算机系统,寻找黑客可能利用的漏洞,例如未打补丁的服务器或配置错误的数据库。

在这个案例中,Sybil标记出了客户在部署联邦GraphQL(一种用于通过应用程序编程接口(API)在Web上指定数据访问方式的语言)时存在的一个问题。这个问题意味着客户无意中暴露了机密信息。

让Ionescu和Herbert-Voss感到不解的是,发现这个问题需要对几个不同的系统以及它们如何相互作用有异常深入的了解。RunSybil表示,他们后来在其他GraphQL部署中也发现了同样的问题——在其他人公开报道之前。“我们搜索了整个互联网,但(相关信息)并不存在,”Herbert-Voss说。“发现它,是模型能力推理上的一大步——一个量级的变化。”

这种情况预示着一个日益增长的风险。随着AI模型不断变得更智能,它们发现零日漏洞和其他漏洞的能力也在持续增强。同样可以用于检测漏洞的智能,也可以被用来利用它们。


专注于人工智能和安全的加州大学伯克利分校计算机科学家Dawn Song表示,AI近期的进展产生了更擅长发现缺陷的模型。模拟推理(将问题分解为组成部分)和代理式AI(如搜索网络或安装和运行软件工具)增强了模型的网络能力。


“前沿模型的网络安全能力在过去几个月里急剧增加,”她说。“这是一个拐点。”

去年,Song共同创建了一个名为CyberGym的基准测试,用于确定大型语言模型在大型开源软件项目中查找漏洞的效率。CyberGym包含了在188个项目中发现的1,507个已知漏洞。

在2025年7月,Anthropic的Claude Sonnet 4能够找到基准测试中约20%的漏洞。到了2025年10月,一个新模型Claude Sonnet 4.5就能够识别30%。Song说:“AI代理能够以极低的成本找到零日漏洞。”

Song表示,这一趋势表明需要新的对策,包括让AI帮助网络安全专家。“我们需要考虑如何真正让AI在防御端提供更多帮助,可以探索不同的方法,”她说。

一个想法是,前沿AI公司在模型发布前与安全研究人员共享模型,以便他们可以使用这些模型来查找错误并保护系统,然后再进行公开发布。

Song补充说的另一种对策是,从根本上重新思考软件的构建方式。她的实验室已经证明,可以利用AI生成比当今大多数程序员使用的代码更安全的代码。“从长远来看,我们认为这种安全即设计(secure-by-design)的方法将真正帮助防御者,”Song说。

RunSybil团队表示,在短期内,AI模型的编码技能可能意味着黑客将占据上风。“AI可以生成在计算机上的行为,也可以生成代码,这两点是黑客所做的事情,”Herbert-Voss说。“如果这些能力加速发展,也意味着攻击性安全行动也会加速。”




这是Will KnightAI Lab 时事通讯的一个版本。可以在此处阅读往期通讯。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区