目 录CONTENT

文章目录

2025年AI炒作泡沫的巨大修正

Administrator
2025-12-16 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.technologyreview.com/2025/12/15/1129174/the-great-ai-hype-correction-of-2025/

原文作者:Will Douglas Heaven


一些幻灭是不可避免的。当OpenAI在2022年底发布一个名为ChatGPT的免费网络应用时,它改变了整个行业——以及好几个世界经济体的轨迹。数百万人开始与他们的电脑交谈,电脑也开始回应他们。我们被迷住了,并期待更多。


我们确实得到了更多。科技公司争相保持领先地位,竞相推出超越彼此的新产品:语音、图像、视频。随着不间断的相互竞争,人工智能公司将每一次新产品的发布都宣传为重大突破,巩固了人们的一种普遍信念,即这项技术只会不断进步。吹捧者告诉我们,进步是指数级的。他们发布了图表,描绘了自去年模型以来我们取得了多大进步:看看这条线上升的趋势!生成式AI似乎无所不能。


好吧,2025年是清算之年


本文是《麻省理工科技评论》炒作修正系列的一部分,该系列旨在重塑人们对AI是什么、它能做什么以及我们下一步该走向何方的期望。

首先,顶尖AI公司的领导者做出了他们无法兑现的承诺。他们告诉我们,生成式AI将取代白领劳动力,带来一个丰裕的时代,促进科学发现,并帮助找到新的疾病治疗方法。全球经济,至少在北部地区,出现的错失恐惧症(FOMO)促使首席执行官们修改了计划,试图加入这场热潮。


就在那时,AI的热度开始消退。尽管这项技术被宣传为可以改造过时的商业流程并削减成本的通用多功能工具,但今年发表的几项研究表明,企业未能让AI的“仙尘”发挥魔力。来自美国人口普查局和斯坦福大学等各种来源的调查和追踪数据显示,企业对AI工具的采用正在停滞。即使尝试使用这些工具,许多项目也仍停留在试点阶段。如果没有整个经济的广泛支持,尚不清楚大型AI公司将如何收回他们在这场竞赛中已经花费的巨额资金。


与此同时,核心技术的更新已不再像过去那样是颠覆性的飞跃。


最引人注目的例子是GPT-5在8月份失败的发布。OpenAI是点燃(并在很大程度上维持)当前热潮的公司,它本应发布其技术的新一代产品。OpenAI为此炒作了数月:“任何领域的博士级专家,”首席执行官萨姆·奥特曼(Sam Altman)夸口说。另一次,奥特曼发布了《星球大战》中的“死星”图片,没有加任何评论,OpenAI的支持者们认为这是终极力量的象征:敬请期待!人们的期望非常高。


然而,当它问世时,GPT-5似乎——不过如此?随之而来的是自三年前ChatGPT首次出现以来最大的氛围转变。AI研究人员和热门YouTuber扬尼克·基尔彻(Yannic Kilcher)在GPT-5发布两天后发布的一段视频中宣布:“突破性进步的时代结束了:‘通用人工智能(AGI)’不会来了。看起来我们正处于LLM的‘三星Galaxy时代’。”


很多人(包括我)都将此与手机进行了类比。在大约十年的时间里,智能手机是世界上最令人兴奋的消费技术。如今,苹果或三星发布的新产品几乎没有引起轰动。虽然超级粉丝们会仔细研究微小的升级,但对大多数人来说,今年的iPhone看起来和去年差不多。生成式AI是否也处于这种状态?这是否是个问题?当然,智能手机已成为新常态。但它们也改变了世界运作的方式。


需要明确的是,过去几年充满了真正的“哇”时刻,从视频生成模型质量上的惊人飞跃,到所谓推理模型的解决问题能力,再到最新的编码数学模型在世界级竞赛中获胜。但这项出色的技术问世仅数年,在许多方面它仍然是实验性的。它的成功伴随着巨大的限制


也许我们需要调整我们的期望。


大修正

我们必须谨慎:从炒作到反炒作的钟摆可能会摆得太远。仅仅因为这项技术被过度推销就断然否决它是不明智的。当AI未能达到炒作的高度时,人们的本能反应是说进步已经触及了天花板。但这误解了科技领域的研究和创新是如何运作的。进步一直都是磕磕绊绊的。总有绕过、越过或穿过墙壁的方法。


把目光从GPT-5的发布中抽离出来。它是在OpenAI在过去几个月交付的一系列杰出模型之后推出的,包括o1和o3(首创的推理模型,向行业展示了一种全新的范式)以及再次提高了视频生成标准的Sora 2。在我看来,这听起来不像是在撞墙。


人工智能确实非常出色!看看谷歌DeepMind推出的新图像生成模型Nano Banana Pro,它可以将一本书的一章变成信息图表,以及更多功能。它就在你的手机上——而且是免费的。


然而,你不得不思考:当“哇”时刻消失后,还剩下什么?我们一年或五年后会如何看待这项技术?我们是否会认为它值得付出巨大的成本,无论是财务上的还是环境上的?


考虑到这一点,以下是关于2025年底AI状况的四种思考方式:这是亟需的炒作修正的开始。


01: LLMs并非一切

在某些方面,需要修正的恰恰是对大型语言模型(LLMs)的炒作,而非AI的整体。人们已经很清楚,LLMs并不是通往通用人工智能(AGI)的门户,AGI是一种假设性的技术,一些人坚持认为它有一天能够完成人类可以做的任何(认知)任务。


就连AGI的鼓吹者,如AI初创公司Safe Superintelligence的首席科学家兼联合创始人、OpenAI的前首席科学家兼联合创始人伊利亚·苏茨克维(Ilya Sutskever)现在也强调了LLMs的局限性,这项技术他曾极大地参与创造。苏茨克维在11月接受Dwarkesh Patel采访时表示,LLMs非常擅长学习如何执行许多特定的任务,但它们似乎没有学习这些任务背后的原理


这就像学习如何解决一千个不同的代数问题,与学习如何解决任何代数问题之间的区别。苏茨克维说:“我认为最根本的一点是,这些模型在泛化能力上比人类明显要差。”


人们很容易认为LLMs无所不能,因为它们对语言的使用非常引人注目。这项技术模仿人们写作和说话的方式令人惊讶地出色。我们天生就倾向于在某些行为上看到智能——无论它是否真的存在。换句话说,我们制造了具有类人行为的机器,却无法抗拒地认为它们背后有一个类人的心智。


这可以理解。LLMs进入主流生活才几年时间。但在那段时间里,营销人员利用了我们对这项技术实际能力的不确定性,推高了期望,并为炒作注入了动力。随着我们与这项技术共同生活并对其理解得更深入,这些期望应该会回到现实层面。


02: AI并非解决所有问题的快速修复方案

7月,麻省理工学院的研究人员发表了一份研究报告,该报告成为幻灭阵营中的一个重要论点。其主要结果是,高达95%尝试使用AI的企业并未从中发现任何价值


这一主张的总体基调也得到了其他研究的呼应。11月,自由职业者在线市场Upwork的研究人员发现,由OpenAI、Google DeepMind和Anthropic的顶级LLMs驱动的智能体无法独立完成许多简单的工作任务


这与奥特曼的预测相去甚远:“我们相信,到2025年,我们可能会看到第一批AI代理‘加入工作岗位’并实质性地改变公司的产出,”他今年1月在个人博客上写道。


但是,MIT研究中被忽略的一点是,研究人员的成功衡量标准相当狭隘。那95%的失败率包括那些尝试实施定制AI系统,但六个月后尚未将其扩展到试点阶段的公司。对于实验性技术的大量实验没有立即奏效,这不应该令人感到惊讶。


该数字也不包括员工在官方试点之外使用LLMs的情况。麻省理工学院的研究人员发现,他们调查的公司中约有90%存在一种AI“影子经济”,员工正在使用个人聊天机器人账户。但这种影子经济的价值并未被衡量。


当Upwork研究观察到代理与了解其工作的人员一起完成任务的表现时,成功率飙升。结论似乎是,很多人正在自己摸索AI如何能帮助他们完成工作。


这与AI研究人员兼影响者(以及“氛围编程”一词的创造者)安德烈·卡帕西(Andrej Karpathy)所指出的相符:聊天机器人可以在许多不同的事情上比普通人类做得更好(例如提供法律建议、修复Bug、进行高中数学),但它们不如专业人士。卡帕西认为,这可能是聊天机器人受到个人消费者欢迎的原因,它们帮助非专家处理日常问题和任务,但它们尚未颠覆经济,因为这需要超越熟练员工的工作表现。


这种情况可能会改变。目前,不要对AI尚未(或没有)产生鼓吹者所说的对就业的冲击感到惊讶。AI不是快速修复方案,它不能取代人类。但仍有很大的潜力值得挖掘。AI可以融入日常工作流程和业务管道的方式仍在探索之中。


03: 我们是否处于泡沫中?(如果是,哪种泡沫?)

如果AI是一个泡沫,它像2008年的次级抵押贷款泡沫,还是2000年的互联网泡沫?因为它们之间有很大的区别。


次级抵押贷款泡沫摧毁了经济的一个很大组成部分,因为它破裂时只留下了债务和被高估的房地产。互联网泡沫摧毁了很多公司,给世界带来了连锁反应,但它留下了初生的互联网——一个国际化的电缆网络和少数几家初创公司,如谷歌和亚马逊,它们成为了今天的科技巨头。


然后又或许,我们正处于一个与前两者都不同的泡沫中。毕竟,目前LLMs还没有真正的商业模式。我们还不知道杀手级应用会是什么,甚至是否会有这样的应用。


许多经济学家担心,为建设基础设施和满足预期需求而投入的前所未有的资金。但如果需求没有出现怎么办?再加上许多交易的奇怪的循环性——英伟达向OpenAI付款以向英伟达付款,等等——难怪每个人对即将发生的事情都有不同的看法。


一些投资者仍然保持乐观。在11月接受Technology Business Programming Network播客的采访中,国际大型私募股权公司Silver Lake Partners的联合创始人格伦·哈钦斯(Glenn Hutchins)给出了不担心的几个理由。“这些数据中心中的每一个——几乎所有的数据中心——都有一个有偿付能力的对手方,他们签订了合同来接收他们被设计来处理的所有产出,”他说。换句话说,这不是“建好了,人们就会来”的情况——客户已经被锁定了。


他指出,其中一个最大的有偿付能力的对手方是微软。“微软拥有世界上最好的信用评级,”哈钦斯说。“如果你与微软签订了一份合同来接收你数据中心的产出,萨蒂亚是会兑现的。”


许多首席执行官会回顾互联网泡沫并试图吸取教训。有一种看法是:那些破产的公司没有足够的资金坚持到底。那些在崩溃中幸存下来的公司则蓬勃发展。


牢记这一教训,今天的AI公司正试图通过一场可能或可能不是泡沫的时期。留在竞赛中;不要掉队。尽管如此,这是一场绝望的赌博。


但还有一个教训。那些看起来像是边缘业务的公司可能很快就会变成独角兽。以Synthesia为例,该公司为企业制作头像生成工具。风险投资公司Air Street Capital的联合创始人内森·贝奈奇(Nathan Benaich)承认,几年前他第一次听说这家公司时,正值对深度伪造(deepfakes)的恐惧盛行之时,他不确定其技术有何用途,认为没有市场需求。“我们不知道谁会为唇形同步和语音克隆付费,”他说。“结果发现,有很多人愿意为此付费。”Synthesia现在大约有55,000个企业客户,年收入约1.5亿美元。10月,该公司估值达到40亿美元。


04: ChatGPT并非开端,也不会是终结

ChatGPT是深度学习十年的进步的顶峰,深度学习是现代AI的基础技术。深度学习本身的种子早在20世纪80年代就已播下。整个领域至少可以追溯到20世纪50年代。如果以这个背景来衡量进展,生成式AI才刚刚起步。


与此同时,研究正处于白热化阶段。世界主要AI会议收到的高质量论文提交比以往任何时候都多。今年,一些会议的主办方不得不拒绝已经得到审稿人批准的论文,只是为了控制数量。(与此同时,arXiv等预印本服务器已被垃圾AI生成的研究淹没。)


苏茨克维在接受Dwarkesh采访时谈到当前LLMs的瓶颈时说:“这又回到了研究时代。”这并不是一次挫折,而是新事物的开始。


贝奈奇说:“总是有很多炒作的野兽。”但他认为炒作也有积极的一面:炒作吸引了取得真正进步所需的资金和人才。“你知道,就在两三年前,构建这些模型的人基本上只是碰巧做出了点效果的研究书呆子,”他说。“现在,所有在技术领域有才能的人都在研究这个方向。”


我们接下来的路在何方?

不懈的炒作不仅仅来自那些为其昂贵的新技术招揽生意的公司。有大量的人——无论是在行业内还是行业外——都渴望相信机器能够阅读、书写和思考的承诺。这是一个被延续了几十年的狂野梦想


但炒作从来就不可持续——这是一件好事。我们现在有机会修正期望,并以其真实面貌看待这项技术——评估其真实能力,了解其缺陷,并花时间学习如何以有价值(和有益)的方式应用它。“我们仍然在试图弄清楚如何从这个维度极高的信息和技能的黑箱中激发某些行为,”贝奈奇说。


这次炒作修正早就该进行了。但要知道,AI不会消失。我们甚至还没有完全理解我们已经构建了什么,更不用说接下来会发生什么了。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区