📢 转载信息
原文链接:https://www.wired.com/story/sam-altman-says-the-gpt-5-haters-got-it-all-wrong/
原文作者:Steven Levy
GPT-5发布遇冷:Altman坚称“误解”是主因
OpenAI在八月份发布的GPT-5大语言模型,其发布过程算得上是一场小小的灾难。直播期间出现故障,模型生成的图表数字明显错误。在Reddit的AMA(问我任何事)中,用户抱怨新模型不够友好,并呼吁恢复旧版本。但最主要的批评是:GPT-5未能达到OpenAI多年来一直烘造的“空中楼阁”般的期望。虽然它可能让游戏玩得更好了,但批评者认为,这仍然是“同样的游戏”。
怀疑论者抓住了这个机会,宣称AI热潮已到尽头,甚至有人预测AI寒冬即将到来。“GPT-5是有史以来被炒作得最厉害的AI系统,”知名AI泡沫“戳破者”Gary Marcus在接受采访时表示,“它本应实现两个目标:通用人工智能(AGI)和博士级别的认知能力,但它一个都没实现。”更重要的是,他认为这个表现平平的新模型证明了OpenAI的AGI之路——即通过海量扩展数据和芯片组来实现系统指数级智能的策略——已经走不通了。
然而,Sam Altman并不接受这种说法。发布会一个月后,他出现在旧金山Mission Bay区OpenAI新总部的一间会议室里,急切地向我和我的同事Kylie Robison解释,GPT-5完全达到了他此前所有的宣传,他的AGI史诗探索一切顺利。“发布时的氛围有点糟,”他承认,“但现在感觉很棒。”是的,很棒。不可否认,批评声浪已经减弱。事实上,OpenAI最近发布的那个令人震撼的AI视频生成工具,已经将公众的注意力从GPT-5令人失望的首次亮相上转移开了。但Altman传达的核心信息是:那些唱衰的人站在了历史的错误一方。他坚称,通往AGI的旅程仍在正轨上。
数字游戏:GPT-5的真正价值被低估?
批评者可能将GPT-5视为AI之夏的余晖,但Altman和他的团队辩称,GPT-5巩固了AI技术作为不可或缺的导师、颠覆搜索引擎的信息来源,以及科学家和程序员的复杂协作者的地位。Altman声称用户正开始认同他的观点。“GPT-5是第一次让人们真正感到‘我靠,它真的能帮我解决这个重要的物理学问题’。或者生物学家会说,‘哇,它真的帮我弄明白了这件事。’”他说,“发生了某些重要的事情,这在GPT-5之前的任何模型上都没有发生过,那就是AI开始帮助加速发现新科学的进程。”(OpenAI尚未透露这些物理学家或生物学家具体是谁。)
那么,最初反应为何如此平淡?Altman和他的团队分析出几个原因。首先,自GPT-4发布以来,公司不断推出具有变革性的版本,特别是他们增加的复杂推理模式。“从4到5的飞跃比从3到4的飞跃要大得多,”Altman说,“我们一路展示了太多东西,所以人们的期望值被抬得太高了。”OpenAI总裁Greg Brockman也表示认同:“我并不惊讶很多人会感到失望,因为我们一直在展示我们的底牌。”
OpenAI还表示,由于GPT-5是针对科学研究或编程等专业用途进行优化的,普通用户需要更长时间来欣赏其优点。“大多数人不是物理研究人员,”Altman观察到。正如OpenAI研究主管Mark Chen所解释的那样,除非你本身就是数学天才,否则你可能不会太在意GPT-5在数学奥林匹克竞赛中能排进前五名,而去年该模型只能排名前200。
至于说GPT-5证明了“规模化”策略无效的指控,OpenAI认为这是误解。与之前的模型不同,GPT-5的主要进步并非来自于更大规模的数据集和更多的计算量。新模型的优势来自于“强化学习”(Reinforcement Learning),这是一种依赖专家人类提供反馈的技术。Brockman表示,OpenAI已经将模型发展到可以产生自己的数据来驱动强化学习循环的程度。“当模型很笨时,你只想训练一个更大的版本,”他说。“当模型变聪明时,你想从中采样。你想在它自己的数据上进行训练。”
Altman和团队似乎对GPT-5的批评感到受伤,并对此表示难以置信,认为人们居然认为规模化假设已经失效了。OpenAI显然没有放弃对大规模计算的追求。这就是它斥巨资(数千亿美元)在德克萨斯州阿比林等地建造大型数据中心的原因。Brockman暗示,在这些巨大的计算工厂上线之前,根本没有足够的火力来实现下一次重大飞跃。“规模化的挑战是艰巨的,”他说。“它的执行难度非常非常大,就像建造一个更大的火箭——建造一个两倍大的火箭可能要困难十倍。”
当我提到Marcus时,Altman的表情明显被冒犯了。“你是在问一个真正的问题吗?”他问道。我说,不只是Gary。Altman挺直了身子。“我可以自信地告诉你,GPT-6将显著优于GPT-5,而GPT-7将显著优于GPT-6。而且我们在这些方面的记录相当不错。”
AGI:目标还是过程?
今年早些时候,Altman花了数月时间谈论AGI的即将来临。然而,最近OpenAI开始引导人们不要将AGI视为一个终点,而是一个过程。这听起来很合乎逻辑,但这种措辞上的调整使得公司摆脱了明确的最后期限。“我们犯了一个几乎是范畴性的错误,把OpenAI视为一个有明确结束日期的项目,”Brockman说。“我们曾经的想法是,‘好吧,如果我们能造出AGI,并让它对人类有益,这就是我们在这里要做的。’我们现在不再这样想了。”他表示,现在它更像是一个永无止境的推广过程。“使命真的是关于这种持续的影响力,并将经济转变为这个由AI驱动的世界。即使AGI只是一个里程碑——一个定义明确、或许带有一点模糊性的标记——它背后仍然存在这种持续的指数增长。”
当我向Altman提起AGI时,他说讨论这个概念可能帮助不大,因为人们对它的定义差异很大。他运用了他喜欢的访谈技巧,反过来要求我们分享对AGI的定义,仿佛这会对OpenAI产生什么影响一样。在OpenAI的章程中,AGI被定义为“在大多数经济上有价值的工作中表现超越人类的高度自主系统。”Altman现在表示,他的观点已经超越了章程的范围。他关于AGI的思考似乎集中在科学敏锐度上。“我们可以理解‘大多数经济工作’的含义,”他说。“但科学进步的定义对世界来说才是真正的大事。我们很难理解这一点,所以我们谈论得少了。”
因此,GPT-5是迈向那个里程碑的一小步。“我不会声称GPT-5正在进行有意义的科学研究,这显然不是,”Altman说。“但其中存在一丝曙光,我认为到6或7代时,我们会看到更多。”
尽管Brockman称AGI的定义有些“模糊”,但OpenAI正在利用这个缩写进行品牌塑造。在Altman沉思定义时,他的公关人员正好也在场,其笔记本电脑上贴着一个标签,上面写着:“感受AGI”(FEEL THE AGI)。公司总部一楼的商品售货亭也出售印有相同字样的T恤。走廊里挂着宣传海报,强调通往AGI的道路上的问题,并解释“AI青春期”等现象,将其定义为“一个系统从狭义AI向更通用的人类智能过渡的过渡阶段,表现出不可预测或笨拙的行为”。无论AGI是一个过程还是一个终点,OpenAI都将与其永远联系在一起。为了实现这一目标,它愿意投入数千亿美元进行规模化扩张。
Kylie Robison 补充报道。
这是Steven Levy的 Backchannel 通讯的一个版本。可以 在此处阅读往期通讯。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
评论区