📢 转载信息
原文链接:https://www.qbitai.com/2025/10/341378.html
原文作者:henry (来自 量子位 QbitAI)
你今天做的工作,或许根本不算“真正的工作”?
这句话出自OpenAI CEO萨姆·奥特曼(Sam Altman)与Rowan Cheung的最新一次深度对话。在这场长达30分钟的访谈中,奥特曼不仅分享了自己对AI与未来工作的思考,还透露了GPT-6的进展、AGI的设想、AI未来的交互模式,以及他对Sora恶搞的看法。
对话内容涵盖了从前沿科技到行业动态的多个维度,信息量巨大。
DevDay回顾:ChatGPT成为新的应用分发平台
Q:在DevDay 2025发布的所有内容中,您最兴奋的是哪一点?
Sam Altman:我都很兴奋。将应用引入ChatGPT这个想法其实酝酿已久,但最让我兴奋的是看到大家使用Agent Builder构建出的各种应用。无论是在Agent Builder还是Agent Kit中,都有许多让我渴望亲自尝试的功能。但如果非要选一个,我认为在ChatGPT中直接运行应用将是最棒的。
Rowan Cheung:每周活跃用户达到8亿的ChatGPT已经成为了新的分发平台。开发者和创业者该如何利用Apps SDK在这个平台上构建应用呢?
Sam Altman:我觉得我们需要经历一些迭代,才能真正摸清用户会如何使用这些功能。比如,用户是习惯通过应用名称来调用,还是希望ChatGPT能主动推荐他们常用的应用?未来,开发者可能会摸索出一种新的、自然的应用程序分发机制。不过,任何新产品发布后,总会被各种意想不到的使用方式所惊喜。
Rowan Cheung:您是否也发布了指导文档,教开发者如何提高被推荐的几率?
Sam Altman:是的,但需要附带免责声明。新产品迭代迅速,我们也会在实践中共同学习。
Rowan Cheung:回到两年前的第一次Dev Day,你们推出了GPT Builder,反响热烈。从那时到现在,Agent Builder取得了哪些突破?
Sam Altman:最大的变化在于模型本身变得更强大了。回想第一次Dev Day,那时模型的性能与现在相比,差距巨大——仅仅22、23个月,模型能力取得了惊人的进步。同时,我们也学到了很多关于用户希望如何构建Agent的经验。他们不仅希望在ChatGPT上构建,也希望能在其他平台上使用。最让我印象深刻的是,现在通过可视化界面、上传文件、授权数据源,并描述需求,几分钟内就能部署一个相当复杂的系统。昨天在彩排时我第一次完整体验了这个流程,感到非常震撼。借助Codex、Agent Kit等工具快速开发软件的体验,简直是“地壳变动”。
Rowan Cheung:现在Agent Builder几乎可以实现零代码构建Agent,是吗?
Sam Altman:是的,但如果你懂一些或很多代码,可以实现更复杂的功能。即使是普通知识工作者,也可以开始构建Agent了。可以说,这是针对Agent的“零代码革命”。
Rowan Cheung:这对下一波创业者或开发者意味着什么?
Sam Altman:我一直在思考这个问题。昨天后台看Romain的演示时,我心想:如果是一年前做这些,需要花多长时间?而现在几乎是实时完成,我感觉自己的创意都跟不上它的速度了。我不完全确定这会带来什么改变,但可以肯定的是——全球将编写的软件数量会大幅增加,测试和迭代创意所需的时间将大大缩短。你可以尝试更多想法,更快找到好点子。但具体会带来什么变革,我还没有完全弄清楚。
距离首家纯血Agent独角兽还有多久?
Q:第一家完全由Agent驱动的十亿美元公司何时诞生?Agent Builder能达到那种自主水平了吗?
Sam Altman:还没有。我们过去有一个小赌局,预测第一家单人十亿美元公司何时出现,现在虽然还没正式设立,但大家都在猜测,比如第一家“零人公司”。
Rowan Cheung:几个月?几年?
Sam Altman:我预期是几年。但现在我们甚至可以有信心地讨论:你输入一个提示词(Prompt)到聊天机器人,它就能自主运行。这本身就非常了不起了。
Rowan Cheung:但我们看到的一些Agent产品,仍然需要大量人工监督和反馈。什么时候Agent才能连续工作一周而无需人工干预?
Sam Altman:我觉得Codex距离完成一周的工作不远了。虽然不一定是2025年,但今天我跟一些人聊,他们都说现在的模型已经能完成一整天的工作了,速度太快了。我很少觉得AI的进步让我头晕目眩,但观察Codex完成任务时间延长的速度,这次确实让我震惊。可以预期,一周级别的任务也不会太远了。
Rowan Cheung:技术瓶颈在哪里?
Sam Altman:更智能的模型、更长的上下文窗口、更强的记忆能力。
Rowan Cheung:所以你们有Agent,各种模型升级,Codex,还能用API。回想一下,如果把一个20岁刚从斯坦福退学的年轻人带到现在,给他你现在掌握的所有知识,你会让他构建什么?又不会构建什么?
Sam Altman:我前几天也在想这个问题。我很羡慕现在这一代的20岁“辍学者”,因为能构建的东西太多了,机会空间极其广阔。过去几年,我几乎没有完整的心智空间去认真思考自己会做什么。但我知道,有很多很酷的东西可以做。今天和大家聊这些项目,真的让人非常兴奋。
Rowan Cheung:我现在和很多开发者都在思考:现在能做的事情太多了。在构建产品时,您有什么建议,如何找到独特的护城河来保持领先优势?是通过分发渠道、数据,还是某种工作流模式?
Sam Altman:从抽象层面回答这个问题总是很困难,因为最好的独特优势本质上就是独特的——你必须自己去摸索。OpenAI花了很大的力气才找到我们的优势。总的来说,这个问题没有一个放之四海而皆准的答案。
最好的答案,是你找到只适合你正在做的事情、你的产品、技术,以及你在市场上的位置和时机的那种优势。这通常也是创办新事物时创造价值的重要部分。
我能说的一个通用经验是——你边做边摸索。有一句我一直很喜欢的商业名言:“让战术成为战略。”你可以从做那些有效的事情开始,令人惊讶的是,在这个过程中,常常会自然而然地出现可以发展成战略的东西。
如果你当年问我,我们启动ChatGPT时,哪些会成为持久优势,我会说完全不知道。我可能有一些猜测,但不会很自信。后来证明最令人兴奋的一个例子是——记忆(Memory),它成为了我们的重要竞争优势,也是用户持续使用 ChatGPT 的原因。那时我们完全没考虑到这一点。你开始构建功能,然后有时候就会自然浮现出“哦,这可能成为我们一个非常持久的优势”。
GPT-6:为产品打造更优模型
Q:在GPT-6上,您觉得应该建立哪些优势?或者说,在构建产品时应该重点思考什么?
Sam Altman:这其实就是你必须自己去摸索的部分。我很乐意找机会一起头脑风暴,那会很有趣。但说实话,OpenAI占据了我几乎所有的思考空间,我没机会去认真考虑如何创办新公司,这有点遗憾。AI改变了世界的很多方面,但促成公司优势的基本因素不会因此改变。比如网络效应、品牌与营销优势、用户数据,以及市场效应。如果你列一个清单,看过去几年什么方式行得通,现在看大致相同,但可能会有新的战术去建立这些优势。
Rowan Cheung:最近你们推出了GDPval基准,用来衡量AI模型在主要知识工作岗位中实际经济任务上的表现。令我惊讶的是,GPT-5排在第二,仅次于Claude的Opus模型。你们能发布这样的结果,非常厉害,怎么看待这个结果?
Sam Altman:首先,如果我们不愿意发布模型排名第二的结果,那就太糟糕了。总会有我们做得最好的事情,也会有做得不如别人的地方。建立持续进步文化的方式就是——愉快而坦诚地承认,在某些基准或评测上,别人比你做得更好。我认为Claude团队在理解企业用例和漂亮地呈现输出上做得非常出色,所以我一点也不意外,反而受到了激励要做得更好。
Rowan Cheung:这个基准会影响你们构建GPT-6的方式吗?
Sam Altman:会影响我们部分后训练(post-training)的方式,但我认为GPT-6的整体策略不会改变。
AGI:无需夸大,也不必低估
Q:您对AGI(通用人工智能)的定义是——当它在大多数经济价值最高的工作上超越人类时。那么在GDPval评分上,什么时候您会认为我们已经达到了AGI?
Sam Altman:我一直在思考这个问题。首先,像很多人一样,我对AGI有多个定义。越接近它,这个概念就越模糊。但我最关心的一点,也是让我惊喜的是,我们终于到了一个开始发生的时刻——那就是当AI能够进行新颖发现,能够扩展人类知识总量的时候。这些成就目前都很小,我不想夸大。
但你现在可以在Twitter上看到很多例子,各个学科的科学家们说,AI做出了一个小发现、提出了新方法、或者解决了某个问题。再强调一遍,我既不想夸大,也不想低估。这才是真正重要的事情。而我们正处在这一切的开端,并且乐观地认为未来几个月、几年我们能大力推动,这是件大事。这可能是我最关心的“AGI”指标。
Rowan Cheung:有没有特别让您兴奋的科学突破,想让AI去解决或发现的?
Sam Altman:当然,治愈疾病,发现新的物理规律,那会很棒。但即便是现在发生的小事,比如数学方面的进展,也让我觉得很重要。当GPT-4推出时,我就有这种感觉。我知道关于图灵测试存在很多争议,但大众对图灵测试的认知,曾经觉得它遥不可及,结果一旦AI通过了,人类社会基本没有更新认知。大家兴奋两周后,就开始抱怨为什么AI不够快,或者这不管用,让它更好。这也体现了人类的伟大——那项“AI永远的测试”就这么过去了,而我们都适应了。我感觉现在也会发生类似的事情——我们会逐渐习惯AI做科学发现。
Rowan Cheung:最近斯坦福做了一项“workslop”研究。这个词用来描述一种低回报的AI输出——表面看起来很完美,但实际上会因为返工增加额外工作量。
研究调查了1000多名办公室职员,结果显示有41%的人过去一个月里曾遇到同事产生的workslop,也就是同事使用AI生成的内容需要自己额外花时间去修改或清理。平均每次清理耗时1小时56分钟,每位员工每月因此损失约186美元。
如果AI能像在场许多人一样将某些人的工作效率提高10倍,那么就需要系统的教育和培训,让大家明白什么时候该用AI,什么时候不该用。
Sam Altman:首先,很多人类自己也会产生类似workslop的东西,这不是AI独有的现象。比如,有些邮件只会增加额外工作,或者会议本身也可能拖慢效率。所以不必期待AI会不同。经济会自我调整,利用工具提高效率的人和公司,会比那些用工具拖慢组织的人,更能影响未来。当然,像使用任何新工具一样,会有学习曲线,但我认为速度会很快。
Rowan Cheung:OpenAI有没有做教育或培训,帮助人们更好地建立、学习这些AI的使用?
Sam Altman:有的。人们总会用工具去做自己想做的事。我学到的一点是,你可以制作很棒的教育内容和培训,但人们会去尝试各种奇怪玩法,比如让AI鹦鹉学舌什么的。不过我们确实尝试创造很多内容,帮助大家在工作流中使用AI。在Codex的一些场景中,采用速度非常快,整个公司的集成和高效使用只需几天或几周。
Sora恶搞与未来交互
Q:Sora上全是恶搞您的视频,您害怕吗?
Sam Altman:其实没想象中奇怪。看一个有点,但看上百个就还行。
当时团队有人问我,可不可以让我的Cameo功能开放?这是新技术,我觉得如果我都不尝试,那就是我的失误,所以我就决定做了。后面坐飞机的时候,我想会不会看起来很怪,结果刚上线时确实有点,但很快就适应了——显然这是一个充满生成视频的应用,这些内容很有趣。
Rowan Cheung:我唯一担心的是去水印的问题。今早有几家公司推出了Sora水印去除工具。如果别人可能去掉水印然后在社交媒体上发布,会影响我的个人品牌吗?这是个什么样的机制?
Sam Altman:首先,我们发布这类技术的原因之一,是因为我们看到它终将普及。未来几个月或几年,会有优秀的开源模型,任何人都能用公开的视频生成您的影像。社会最终会适应。我们发现,一种方式是提前发布并设定护栏,让社会和技术有时间共同进化。
这种方法有效。文本相对简单,视频会更难,因为视频冲击力更强,但我相信我们会学会适应。很快大家会意识到,网络上会有大量无水印、开源模型生成的假视频,这不可避免。提前让社会适应这一点,可能有价值。
Rowan Cheung:Sora的目标是生成几乎无法分辨的AI视频?
Sam Altman:目标是AGI。我认为高质量的视频对实现AGI很重要,原因有很多,比如空间推理、我们可以从世界模型中学到的东西。希望有一天,机器人领域的真正进展也会非常重要。但我觉得优秀的视频是件好事——我不希望未来的唯一交互界面只是文字。我非常期待未来能有实时视频流的交互体验,它会不断生成全新的用户体验。这会很棒。但最重要的是,我认为这是通向真正AGI的一条非常有价值的路径。
Rowan Cheung:周五,您发布了一篇博客,说可能会探索对允许在Cameo中使用自己面孔的人进行收入分成。能分享一些细节吗?这个怎么运作?
Sam Altman:是的,很多时候,当你发布一个新产品时,会发现人们使用的方式与你预期的不同。我们原本认为会有少量创作者制作非常酷、非常复杂的视频并分享出去,然后有大量观众观看。确实有这种情况。但实际上,大量用户只是给三五好友制作视频,在群聊里分享,而不是在社媒里。我不确定这种使用方式能否持续,但如果持续,它会大幅影响计算资源需求与用户互动的比例。
未来可能会让人们为生成视频付费。比如你每天生成100个视频发给朋友,或者你想生成包含某位名人的视频(并且他们也同意),也许可以对生成付费分成。我们需要实验看看如何操作。
不过,我不喜欢对一个六天前刚上线的产品下定论,这一切可能只是新鲜感,也可能不会形成长期使用场景。但至少到目前为止,它的使用量很大。
Rowan Cheung:您考虑过在Sora App中放广告吗?
Sam Altman:还没有,但这方面有趣的可能性也很大。当然,也可能有可怕的做法。与ChatGPT不同,我们可以用订阅模式获得收入;但如果Sora用户主要是在信息流中浏览内容,那么广告可能是更自然的模式。
如果主要是私信,那又是另一种模式。我乐观地认为,也许到今年年底,或者更现实地说,到明年第一季度末,我们能理解产品的最终形态,并据此设计商业模式。我认为按生成次数收费是合理的,也值得尝试。其他商业模式则取决于产品如何发展。
AI能“淘汰”的工作,本身就不算工作?
Q:智能时代,十亿知识工作岗位可能会首先被影响,然后才会创造新工作。您怎么看?
(注:如果50年前告诉农民,互联网会创造十亿个新工作岗位,他们可能不会相信。同样的,现在很多人认为AI会创造很多新工作岗位。)
Sam Altman:我觉得农民不仅不会相信会发生这样的事情,他们可能会看你做的工作(互联网媒体),觉得那不是真正的工作。
种地是在提供人们真正需要的东西,养活他们,这才是真正的工作。而我们这些人,生活条件优越,食物丰富,财富充足,我们做的很多事情像是在打发时间的游戏,需要感到重要,但可能不算“真正工作”。
对我们而言,这些工作感觉很真实。我很感激能做一些既令人满足又重要的事情。未来的工作可能会非常不同,可能比现在我们认为的工作形式更轻松。但我相信人类的内在驱动力仍然存在,我们会找到很多事情去做。
Rowan Cheung:希望我们还能探索太空。您觉得AGI出现后,人类会重点关注什么?
Sam Altman:我希望一切都能向各个方向发展,去做所有事情。太空对我来说很酷,但你或其他人可能有自己觉得有趣的方向。我希望一切皆有可能。
Rowan Cheung:如果明天可以制定一条全球政策,您会定什么?
Sam Altman:很难只选一条。但我一直在思考AI监管的问题——是否合理,是否会让大公司占优势。我认为,当模型非常强大时,应该有全球性的框架来降低灾难性风险,尤其是针对最前沿的安全问题。如果有一条全球政策能做到这一点,那将非常好。
ChatGPT会成为“美国版微信”吗?
Q:在中国,微信几乎是一个“万能App”,购物、社交、聊天都能做。现在ChatGPT也有购物、网页搜索、Sora等功能,你们是不是想打造一个美国版微信?
Sam Altman:不,有很多原因让我认为这种方式在美国市场行不通。我们想做的是一个真正优秀的AI超级助手。
Rowan Cheung:为什么要把功能单独推出?比如Sora是独立App,为什么不直接放进ChatGPT?
Sam Altman:ChatGPT对很多人来说是最个人化的账号,把社交体验放进去会显得奇怪。可以想象做消息功能,因为人们会分享和协作。但人们对ChatGPT的认知和娱乐App的认知差别很大,可能会产生不协调。当然,很多功能我们还是放进了ChatGPT。
Rowan Cheung:您觉得最重要、最有用的代理(Agents)是什么?最让您兴奋的是什么?
Sam Altman:可以看看Codex的发展,并思考在其他行业的应用。比如法律、财务建模等,是否可以有类似Codex的体验。已经有优秀的初创公司在做这些事情。随着技术成熟,如果这些工具在各自行业中能达到Codex在编码领域的水平,那将是我最兴奋的方向。我能想象一个世界:你只用与一堆代理对话,就能启动一家初创公司。我认为Agent Builder或Agent Kits还不够好,但可以看到从这里到那里的路径。
奥特曼:语音不是交互的最终形式
Q:之前您在主题演讲里提到过语音可能是AI或Agent的最终形式,能详细说说吗?
Sam Altman:我不认为语音是交互的最终形式。有很多时候,语音并不是合适的交互方式。
比如你在公共交通站,边走边讲话,这会很烦人。但很多时候,语音是非常自然的交互方式。语言本身就是这样,但有时候是语音,有时候是打字,这里其实还没有盖棺定论。
我们都习惯了智能音箱这类产品,虽然经常被拿来开玩笑,但很多人真的在使用并喜欢它们。而智能音箱其实还不够好,不是因为概念错,而是当时AI不够强大,周边基础设施也不够完善。想象一下,如果你只需对设备说话,它就能准确完成你想要的操作,然后几乎不打扰你——那种体验,就像是我理想中想要使用的计算机。
Rowan Cheung:你们会做语音交互吗?
Sam Altman:这需要一段时间。我们需要耐心去打造一种全新的设备,在大规模上实现超高质量。这是完全不同的电脑使用方式,我们需要创造性的空间去探索。
我们确实有一些很让人兴奋的想法,但目前还不能透露,也不会在短期内透露。不过我们会努力做出一种非常值得等待的产品。

参考链接:
[1]https://www.youtube.com/watch?v=zwnVUiwObl8
[2]https://futurism.com/artificial-intelligence/sam-altman-real-work-ai
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区