目 录CONTENT

文章目录

深入了解 OpenAI 如何奋力追赶 Claude Code

Administrator
2026-03-11 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/openai-codex-race-claude-code/

原文作者:Maxwell Zeff


Sam Altman 盘腿坐在办公椅上,深邃地凝视着天花板。说实话,位于旧金山 Mission Bay 的 OpenAI 新总部——一座玻璃与浅色木材构成的圣殿——似乎就是为了激发这种沉思而设计的。接待处后面的一个售货亭里摆放着小册子,将“AI 的时代”描述为通往启蒙之路的阶梯。楼梯沿墙的标语记录着 AI 的里程碑式胜利,比如有一次,成千上万的人通过直播观看一台机器在 Dota 2 游戏中击败顶尖电竞选手。在走廊里,研究人员身着神圣的周边商品擦肩而过。一件 T 恤上写着“好的研究需要时间”。理想情况下,时间不宜过长。

Altman 和我身处一个巨大的会议室。我向他提出的问题是关于 AI 编程革命——以及为什么 OpenAI 似乎没有引领这场革命。数百万软件工程师已经开始将编程任务委托给 AI,迫使许多硅谷人士首次开始反思自己的工作被自动化的问题。编程助手已成为企业愿意为 AI 大量付费的少数几个领域之一。这一刻本应(而且可以说应该)成为 OpenAI 楼梯上又一个胜利的标语。但现在大写字母的名字属于另一个人。

Anthropic,一家由 OpenAI 叛逃者创立的规模较小的竞争对手,凭借其编程助手 Claude Code 取得了空前的成功。该公司表示,该产品占其业务的近五分之一,年化收入超过 25 亿美元。据一位直接了解情况的人士透露,截至 1 月底,OpenAI 的同类产品 Codex 的年化收入略高于 10 亿美元。这是怎么回事?

“第一个进入市场非常有价值,” Altman 终于说道。“我们通过 ChatGPT 实现了这一点。”但他表示,现在是 OpenAI 加大投入编程的时候了。他认为公司的 AI 模型已经足够强大,可以驱动功能强大的编程助手。(当然,该公司为此投入了数十亿美元进行训练。)“这将是一项巨大的业务——仅仅是它的经济价值,以及编程能够带来的通用工作的解锁,” Altman 说。“我不是轻易说这话,但我认为这是一个罕见的万亿美元级市场。”更重要的是,他说,Codex 是实现“通用人工智能”的“最可能途径”。根据 OpenAI 的定义,通用人工智能是指一个能够胜任大多数经济上有价值工作的 AI 系统。

Sam Altman

Sam Altman, OpenAI's chief executive officer.

Photograph: MARK JAYSON QUINES

然而,尽管 Altman 从他那宁静的盘腿姿势中自信地发表声明,但过去几年公司内部的现实却更加混乱。为了了解内幕,我采访了 30 多人,包括 OpenAI 的现任领导者和员工(他们是在公司批准下接受采访的),以及一些为了讨论私营公司的内部运作而选择匿名的人。他们的叙述描绘了一幅 OpenAI 处于一个它几乎从未有过的境地的画面:奋力追赶。

早在 2021 年,Altman 和 OpenAI 的其他领导人邀请 WIRED 记者 Steven Levy 前往他们位于旧金山 Mission 区的原始办公室,观看一些新东西。这是 OpenAI GPT-3 模型的一个分支,训练了来自 GitHub 的数十亿行开源代码。在一次演示中,高管们展示了名为 Codex 的工具如何接收英文指令并输出简单的代码片段。

“它实际上可以在计算机世界里代表你行动,”当时 OpenAI 的总裁兼联合创始人 Greg Brockman 说。“你真的有了一个可以执行命令的系统。”即使在那时,OpenAI 的研究人员也认为 Codex 将是开发“超级助手”的关键,这一点显而易见。

此时,Altman 和 Brockman 的生活围绕着与 OpenAI 最大投资者微软的会议展开。这家软件巨头正在利用 Codex 来驱动其首批商业 AI 产品之一——一个名为 GitHub Copilot 的代码补全工具,该工具可以在程序员的常规环境中工作。一位早期 OpenAI 员工告诉我,Codex “当时能做的不仅仅是自动补全”,但微软的高管将其誉为 AI 未来的标志。当 GitHub Copilot 于 2022 年 6 月公开推出时,在几个月内吸引了数十万用户。

Greg Brockman

Greg Brockman, OpenAI's president.

Photograph: MARK JAYSON QUINES

OpenAI 的第一个 Codex 团队转而去处理其他项目。该员工表示,公司计划将编码能力整合到未来的模型中,认为没有必要单独进行一项工作。一些工程师被重新分配到 DALL-E 2,即该公司的图像生成器。其他人则转去训练 GPT-4,这被认为是让 OpenAI 更接近 AGI 的最佳方式。

然后,ChatGPT 于 2022 年 11 月推出,并在两个月内获得了超过 1 亿用户。其他所有项目都停止了。一位前 Codex 团队成员说,在接下来的几年里,OpenAI 没有专门的团队致力于 AI 编程产品。这似乎脱离了公司新近转向消费者关注的焦点。他们还补充说,“感觉这个领域已经被 GitHub Copilot ‘覆盖’了”。OpenAI 会提供新模型来驱动该工具,但这属于微软的地盘。

OpenAI 在 2023 年和 2024 年的大部分时间都投入到了多模态 AI 模型和代理的研发中——这些模型旨在理解文本、图像、视频和音频,并能像人类一样控制光标和键盘。这项努力似乎更符合 AI 行业的发展方向。初创公司 Midjourney 因其 AI 图像模型而病毒式传播,普遍认为大型语言模型需要看到和听到世界才能获得真正的智能。

Anthropic 则采取了不同的道路。它也涉足聊天机器人和多模态模型,但该公司似乎比 OpenAI 更早认识到编程的潜力。在最近的一次播客中,Brockman 称赞 Anthropic 从早期就“非常专注于编程”。他指出,Anthropic 不仅在学术竞赛的困难编程问题上训练其 AI 模型,还在混乱的代码库的实际问题上进行了训练。“这是一个我们有所延迟的教训,” Brockman 说。

2024 年初,Anthropic 在训练 Claude Sonnet 3.5 时使用了其中一些混乱的代码库。当该模型于当年 6 月发布时,许多用户对其编程能力印象深刻。在一家名为 Cursor 的初创公司尤其如此,该公司由一群二十多岁的年轻人创立,他们允许开发者通过用普通英语提问来与 AI 协同编程。据一位接近该初创公司的人士透露,当该公司整合了 Anthropic 的新模型后,Cursor 的使用量开始急剧上升。在几个月内,Anthropic 将开始内部测试自己的版本:Claude Code。

随着 Cursor 的流行度飙升,OpenAI 联系了这家初创公司,希望收购它。据接近该初创公司的人士告诉我,创始人拒绝了这项提议,甚至在谈判进入深入阶段之前就拒绝了。他们看到了编程行业的潜力,并希望保持独立。

Andrey Mishchenko

Andrey Mishchenko, OpenAI's research lead for Codex.

Photograph: MARK JAYSON QUINES

当时,OpenAI 正在训练其首个所谓的“推理模型” o1,该模型可以在给出答案之前逐步解决问题。在发布时,OpenAI 表示该模型“在准确生成和调试复杂代码方面表现出色”。Codex 的研究负责人 Andrey Mishchenko 表示,AI 模型在编码方面越来越强大,一个关键原因是这是一个可验证的任务。代码要么运行,要么不运行——这在模型出错时提供了清晰的信号。OpenAI 利用这个反馈循环来训练 o1 处理越来越难的编码问题。“如果没有能够爬取代码库、实现更改并测试自己工作 else——这些都属于推理的范畴——那么编码助手就不可能像现在这样强大,”他说。

到 2024 年 12 月,OpenAI 内部的几个小团队开始专注于 AI 编程助手。其中一个团队由 Mishchenko 和 OpenAI Codex 负责人、前 Google DeepMind 研究员 Thibault Sottiaux 领导。最初,他们对编程助手最感兴趣的是将其作为加快 AI 研究速度的一种方式——自动化管理训练运行和监控 GPU 集群的繁琐工作。另一个项目由 Alexander Embiricos 领导,他之前曾在 OpenAI 负责多模态代理,现在是 Codex 的产品负责人。Embiricos 创建了一个名为 Jam 的演示,该演示在公司内部广泛传播。

Thibault Sottiaux

Thibault Sottiaux, OpenAI's head of Codex.

Photograph: MARK JAYSON QUINES

Jam 不是通过光标和键盘控制计算机,而是直接访问计算机的命令行。2021 年的 Codex 演示展示了一个可以输出代码供人类运行的 AI,而 Embiricos 的版本可以直接运行代码。他惊叹于跟踪 Jam 操作的网页在笔记本电脑上一次又一次地更新。

“有一段时间,我一直认为多模态交互可能是我们实现使命的方式——比如我们整天都在与 AI 共享屏幕,” Embiricos 说。“然后就变得非常清楚:也许让模型对计算机进行编程访问是我们实现目标的方式。”

这些项目需要数月时间才能合并成一个统一的努力。当 OpenAI 在 2025 年初完成 o3 的训练——这是一个比 o1 更侧重于编码的模型——它终于有了构建真正 AI 编程产品的基础。但 Claude Code 已经准备好公开发布了。

在 Claude Code 于 2025 年 2 月首次以“有限研究预览”形式发布,然后在同年 5 月公开发布之前,当时的先进技术是“氛围编码”(vibe coding)。人们为允许人类程序员在编码项目中进行引导,同时 AI 填写细节的工具支付了数亿美元。但 Anthropic 的新产品,就像 Jam 演示一样,直接从计算机的命令行进行操作,这意味着它可以访问开发者所有的文件和应用程序。这不再是氛围编码;开发者可以完全将工作外包给 AI 助手。

OpenAI 正在争先恐后地推出竞争产品。Sottiaux 告诉我,他于 2025 年 3 月组建了一个“冲刺团队”,其任务是在短短几周内整合 OpenAI 的内部团队并发布一款 AI 编程产品。与此同时,Altman 探索了另一项有助于 OpenAI 取得领先的收购——以 30 亿美元收购 AI 编程初创公司 Windsurf。OpenAI 管理层认为,Windsurf 将提供一个成熟的 AI 编程产品,一个知道如何在其基础上进行构建的团队,以及一个即时可用的企业客户基础。

但 Windsurf 的收购案却被搁置了数月。根据《华尔街日报》的报道,拖延的原因是微软,这家在所有事情上都是 OpenAI 的巨头合作伙伴,希望获得 Windsurf 的知识产权。这家云巨头自 2021 年以来一直使用 OpenAI 的模型来驱动 GitHub Copilot,该产品已成为微软财报电话会议的亮点。但随着 Cursor、Windsurf 和 Claude Code 提供了新的代理式编码体验,GitHub Copilot 开始让人感觉停留在 AI 的早期时代。OpenAI 再推出一款编码产品也无济于事。

Windsurf 的交易发生在一个 OpenAI 和微软关系特别紧张的时期。两家公司正在重新谈判合作关系,OpenAI 试图削弱微软对其 AI 产品和计算资源的控制。Windsurf 的交易成为了这个过程中的牺牲品,OpenAI 收购这家初创公司的交易于 7 月破裂。这时,Google 雇佣了 Windsurf 的创始人;其余团队则被另一家编码初创公司 Cognition 收购。

“我很想完成那笔交易,” Altman 说。“你无法控制每一笔交易。”尽管他曾希望 Windsurf 的收购“能让我们取得一些进展”,但 Altman 表示,他对 Codex 团队的发展轨迹印象深刻。在谈判期间,Sottiaux 和 Embiricos 一直在持续构建和发布更新。Altman 说,到 8 月份,OpenAI 已经按下了加速键。

Alexander Embiricos

Alexander Embiricos, OpenAI’s product lead for Codex.

Photograph: MARK JAYSON QUINES

Greg Brockman 最喜欢衡量 AI 性能的方式是他多年前发明的一个名为“反图灵测试”的电脑游戏。他手工编写了这款游戏,现在他挑战 AI 代理从头开始构建自己的版本。他提供了基本规则:两名人类在各自的电脑上,在屏幕上看到一对聊天窗口。一个窗口连接到另一个人类,另一个窗口连接到 AI。游戏的目标是在欺骗对手认为自己是 AI 的同时,猜出哪个聊天窗口是 AI。

Brockman 说,在去年大部分时间里,公司最强大的模型需要数小时才能构建这样一个游戏,并且需要明确的人工指示和帮助。但到 12 月,Codex 已经能够通过一个精心构建的提示,使用新的 GPT-5.2 模型作为引擎,从一个提示创建了一个功能齐全的游戏。

注意到这一转变的不仅仅是 Brockman。世界各地的开发者们都注意到 AI 编程助手突然变得更加出色。这场主要围绕 Claude Code 展开的讨论,已经走出了硅谷,成为主流新闻。没有编程经验的普通人也开始着手开发定制软件项目。

使用量的激增并非偶然。在此期间,Anthropic 和 OpenAI 在获取 AI 编程助手新客户方面投入了巨资。几位开发者告诉 WIRED,他们每月 200 美元的 Codex 和 Claude Code 套餐,可以让他们获得超过 1000 美元的额度。这些慷慨的额度限制是一种让开发者在工作场所使用 AI 编程产品的方式,这样 OpenAI 和 Anthropic 就可以按使用量收费。

据知情人士透露,在 2025 年 9 月,Codex 的使用量仅为 Claude Code 的 5%。消息人士称,到 2026 年 1 月,Codex 的用户群已上升到 Claude Code 的 40% 左右。

George Pickett 是一位在科技初创公司工作了 10 年的开发者,他最近开始组织围绕 Codex 的聚会。“我认为很明显,我们将用代理来取代白领工作,” Pickett 说。“从社会角度来看,谁他妈知道这意味着什么。这将会是颠覆性的,但我对正在发生的事情相当乐观。”

价值 110 亿美元的生产力初创公司 Notion 的联合创始人 Simon Last 表示,他和他的顶尖工程师们在 GPT-5.2 发布后,在很大程度上出于可靠性原因转而使用 Codex。“我发现 Claude Code 总是欺骗我,” Last 说。“它说它在工作,但实际上并没有。”

Katy Shi

Katy Shi, a researcher at OpenAI who works on model behavior.

Photograph: MARK JAYSON QUINES

在 OpenAI 从事 Codex 行为研究的研究员 Katy Shi 表示,虽然有些人形容其默认的个性是“干面包”,但许多人已经开始欣赏其不那么奉承的风格。“很多工程工作在于能够接受批评性反馈而不将其视为恶意,” Shi 说。

几家大型企业也已签约使用 Codex。“ChatGPT 等同于 AI 这一事实,使我们在 B2B 市场拥有巨大的优势,” OpenAI 应用部门首席执行官 Fidji Simo 说。“公司希望使用其员工已经熟悉的技术。” Simo 表示,OpenAI 销售 Codex 的策略很大程度上是将其与 ChatGPT 和其他 OpenAI 产品打包销售。

思科总裁兼首席产品官 Jeetu Patel 表示,他已告知员工不要担心使用 Codex 的成本,因为他们需要熟悉该工具。当员工问“他们是否会因为使用这些工具而失业”时,Patel 说,“我们必须告诉我们的员工,不,但我保证如果你不使用它们,你就会失业,因为你将不再有竞争力。所以你会被淘汰。”

如今,围绕 AI 编程助手的恐慌已经远远超出了硅谷。《华尔街日报》将 Claude Code 归因于上个月导致了1 万亿美元的科技股抛售,因为投资者担心软件很快就会过时。几周后,在 Anthropic 宣布 Claude Code 可用于现代化改造 COBOL 遗留系统(IBM 机器上普遍使用)后,IBM 的股价经历了 25 年来的最糟糕一天。OpenAI 一直在不懈努力,使其 AI 编程助手成为社会对话的一部分,花费数百万美元在超级碗广告中宣传 Codex,而不是 ChatGPT。

在 Mission Bay 的圣殿里,没有人需要被推销 Codex。我采访过的许多 OpenAI 工程师表示,他们自己几乎不再敲代码了。他们整天都在与 Codex 交流。有时他们会聚集在一起,集体进行这项活动。

在总部,我参加了一场 Codex 黑客马拉松——大约有 100 名工程师挤在一个大房间里。每个人有四个小时的时间用 Codex 构建最好的演示。一位 OpenAI 高管站在房间前面,手里拿着笔记本电脑,一边扭动身体,一边通过麦克风念出团队的名字。团队代表紧张地走到讲台前,用颤抖的声音简短地介绍他们的 AI 项目。获胜者获得了 Patagonia 背包。

许多项目都是用 Codex 创建的,并且旨在帮助工程师更好地使用 Codex。一个小组构建了一个将 Slack 消息总结为每周报告的工具。另一小组构建了一个 AI 生成的、类似维基百科的内部 OpenAI 服务指南。其中许多演示以前需要花费数天或数周才能启动,但现在可以在一个下午完成。

在离开的时候,我遇到了 Kevin Weil,他曾是 Instagram 的高管,现在负责领导 OpenAI for Science,这是该公司为研究人员构建 AI 产品的新部门。他告诉我,Codex 正在为他做一些通宵项目,他将在早上查看。这已经成为 Weil 和数百名其他员工的常规做法。OpenAI 在 2026 年的目标之一是开发一个自动化的实习生,来研究(还能研究什么呢?)AI。

Simo 告诉我,该公司希望 Codex 最终能为 ChatGPT 和所有其产品中的功能提供支持——不是用于编程,而是为人们完成任务。Altman 表示,他很乐意发布一个通用版本的 Codex,但他担心安全问题。他说,一月份,他的一位非技术朋友请他设置 OpenClaw,一个病毒式的 AI 编程助手。Altman 告诉我他拒绝了,因为“目前这显然不是一个好主意”,因为 OpenClaw 可以删除重要文件。在 Altman 告诉我这些几周后,OpenAI 宣布它正在聘请 OpenClaw 的创建者。

我采访的许多开发者告诉我,Codex 和 Claude Code 之间的竞争从未如此激烈。但随着这些工具变得越来越强大——并且被寻求效率的企业领导者越来越广泛地强制使用——社会需要面对的问题比选择哪个编程助手更重大。

Amelia Glaese

Amelia Glaese, OpenAI’s VP of research and head of alignment.

Photograph: MARK JAYSON QUINES

一些监督机构担心,OpenAI 追赶 Claude Code 的竞赛会将安全问题置于次要地位。一个名为 Midas Project 的非营利组织指控 OpenAI 在 GPT-5.3-Codex 上放松了其安全承诺,未能恰当地概述该模型的网络安全风险。OpenAI 的对齐负责人 Amelia Glaese 反驳了安全被 Codex 所牺牲的说法,OpenAI 表示 Midas 误解了公司的承诺。

即使对于 Brockman 来说——他去年向支持 AI 的超级政治行动委员会和支持特朗普的政治行动委员会各捐赠了 2500 万美元,以推进 OpenAI 的使命,并愉快地说“我们正按计划”实现 AGI——新的现实也唤起了复杂的情感。在硅谷的工程师中,他一直以痴迷著称,是那种会在产品发布前夜深入代码库的老板。在很多方面,这种新的放手时代“非常自由,因为你意识到你的大脑负担了许多不必要的细节,”他说。然而,当你成为“这个由数十万代理组成的舰队的 CEO,它们正在完成你的目标、你的愿景”时,他说,“你就不再深入了解具体如何解决各种问题了。”在某些方面,Brockman 说,这种新的工作方式会让你“觉得你正在失去对问题的掌控感。”


在你的收件箱里
想了解来自硅谷 AI 中心地的报道,请订阅 Maxwell Zeff 的每周Model Behavior 时事通讯。

你的看法?
请在下方的评论区告诉我们您对本文的看法。或者,您也可以通过 mail@wired.com 提交给编辑的信件。

0

评论区