目 录CONTENT

文章目录

2025年AI炒作泡沫的伟大修正

Administrator
2025-12-31 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.technologyreview.com/2025/12/15/1129174/the-great-ai-hype-correction-of-2025/

原文作者:Will Douglas Heaven


一些幻灭是不可避免的。当OpenAI在2022年底发布一个名为ChatGPT的免费网络应用时,它改变了整个行业——以及几个世界经济体的走向。数百万人开始与他们的电脑交谈,而电脑也开始回应他们。我们着迷了,并期待更多。


我们确实得到了更多。科技公司争相保持领先地位,推出了一个比一个出色的竞争产品:语音、图像、视频。在不断的相互竞争中,AI公司将每一次新产品的发布都描绘成一次重大突破,巩固了人们普遍的信念:这项技术只会不断进步。拥护者们告诉我们,进步是指数级的。他们发布了图表,描绘了自去年模型以来我们取得了多大进步:看那条线如何向上延伸!似乎生成式AI无所不能。



好吧,2025年是一个清算之年


本文是《麻省理工科技评论》炒作泡沫修正系列的一部分,该系列旨在重设人们对AI是什么、它能做什么以及我们接下来的方向的期望。


首先,顶尖AI公司的负责人做出了他们无法兑现的承诺。他们告诉我们,生成式AI将取代白领劳动力,带来一个丰裕的时代,实现科学发现,并帮助找到新的疾病疗法。全球经济体(至少在北半球)的错失恐惧症(FOMO)促使首席执行官们撕毁了他们的计划,试图加入这场热潮。


就在那时,AI的光环开始褪色。尽管这项技术被宣传为可以改革过时的业务流程并削减成本的通用多功能工具,但今年发布的一系列研究表明,企业未能让AI的“魔法”发挥作用。来自美国人口普查局和斯坦福大学等各种来源的调查和追踪数据显示,企业采用AI工具的速度正在放缓。即使尝试使用这些工具,许多项目也仍停留在试点阶段。如果没有整个经济的广泛支持,那些在这次竞赛中已经投入了巨额资金的大型AI公司将如何收回成本,目前尚不清楚。


与此同时,核心技术的更新不再像以前那样是革命性的飞跃

相关报道

这方面最引人注目的例子是GPT-5在八月份失败的发布。OpenAI——这家引爆(并在很大程度上维持)当前热潮的公司——本应发布其技术的全新一代产品。OpenAI几个月来一直在炒作GPT-5:“任何领域的博士级专家,”首席执行官Sam Altman夸耀道。在另一个场合,Altman发布了一张《星球大战》中死星的图片,没有做任何评论,OpenAI的支持者们将其视为终极力量的象征:即将到来!期望值非常高。


然而,当它问世时,GPT-5似乎——和以前差不多?随之而来的是自三年前ChatGPT首次出现以来最大的“氛围转变”(vibe shift)。人工智能研究员和热门YouTuber Yannic Kilcher在GPT-5发布两天后发布的视频中宣布:“突破性进展的时代已经结束”,“通用人工智能(AGI)不会到来。看起来我们正处于LLM的三星Galaxy时代。”


很多人(包括我)将此与手机做了类比。十多年来,智能手机一直是世界上最令人兴奋的消费技术。如今,苹果或三星发布新产品时几乎没有轰动效应。虽然铁杆粉丝们会仔细研究微小的升级,但对大多数人来说,今年的iPhone看起来和去年的iPhone感觉一样。我们现在对生成式AI也是如此吗?这是否是个问题?当然,智能手机已成为新常态。但它们也改变了世界运作的方式。


需要明确的是,过去几年充满了真正的“哇”时刻,从视频生成模型质量上的惊人飞跃,到所谓的“推理模型”解决问题的能力,再到最新的编码数学模型世界级的竞赛胜利。但这项卓越的技术问世才几年时间,在很多方面它仍然是实验性的。它的成功伴随着巨大的限制条件


也许我们需要调整我们的期望。

宏大的重置

我们在这里要谨慎:从炒作到反炒作的钟摆可能会摆得太远。仅仅因为这项技术被过度推销就应该被否定,这是不明智的。当AI未能达到预期时,本能的反应是说进步遇到了瓶颈。但这误解了科技领域的研发和创新是如何运作的。进步总是断断续续的。总有跨越、绕过或穿过瓶颈的方法。


让我们回顾一下GPT-5的发布。它是在OpenAI前几个月发布一系列出色模型之后紧接着到来的,包括o1和o3(首开先河的推理模型,为行业引入了全新的范式)以及Sora 2,它再次提高了视频生成的标准。这听起来不像遇到了瓶颈。

AI确实非常出色!看看谷歌DeepMind推出的新图像生成模型Nano Banana Pro,它可以将一本书的一章内容转换成信息图表,等等。它就免费地在你的手机上可用。


然而,你也不禁要问:当“哇”的因素消失后,还剩下什么?我们一年或五年后如何看待这项技术?我们会认为它值不值得那些巨大的财务和环境成本吗?


有鉴于此,以下是思考2025年底AI状况的四种方式:一场急需的炒作修正的开始。

01: LLM并非一切

从某种意义上说,需要修正的只是对大型语言模型(LLM)的炒作,而不是整个AI领域。现在已经很明显,LLM不是通往通用人工智能(AGI)的门户,AGI是一种假设的技术,一些人坚持认为它有一天能够完成人类能做的任何(认知)任务。


即使是像Ilya Sutskever这样的人工智能布道者——他是AI初创公司Safe Superintelligence的首席科学家兼联合创始人,也是OpenAI的前首席科学家兼联合创始人——现在也强调了LLM的局限性,这项技术他曾大力推动的。Sutskever在11月接受Dwarkesh Patel的采访时说,LLM非常擅长学习如何执行许多特定的任务,但它们似乎没有学会这些任务背后的原理


这就像学习如何解一千个不同的代数题,和学习如何解任何代数题之间的区别。“我认为最根本的一点是,这些模型的泛化能力比人类差得多,”Sutskever说。

相关报道

很容易想象LLM无所不能,因为它们对语言的使用非常引人入胜。这项技术模仿人们写作和说话的方式的惊人程度令人难以置信。而且我们天生就倾向于在表现出某种特定行为的事物中看到智能——无论这种智能是否真的存在。换句话说,我们制造了具有类人行为的机器,却忍不住认为背后有一个类人的心智。


这是可以理解的。LLM进入主流生活才几年时间。但在那段时间里,营销人员利用了我们对这项技术真正能力的模糊认识,推高了期望并加速了炒作。随着我们与这项技术共处并更好地理解它,这些期望应该会回归理性。

02: AI不是解决你所有问题的速效药

七月,麻省理工学院的研究人员发表了一项研究,该研究成为幻灭阵营中的一个重要讨论点。标题结果是,高达95%尝试使用AI的企业发现它对自己毫无价值。


其他研究也呼应了这一总体论点。十一月,一家经营自由职业者在线市场的Upwork公司研究人员的研究发现,由OpenAI、谷歌DeepMind和Anthropic等顶级LLM驱动的智能体无法独立完成许多直截了当的工作场所任务。


这与Altman的预测相去甚远:“我们相信,到2025年,我们可能会看到第一批AI智能体‘加入劳动力大军’并对公司的产出产生实质性影响,”他一月份在自己的个人博客上写道。


但MIT研究中被忽略的一点是,研究人员的成功衡量标准相当狭窄。这个95%的失败率计算的是那些尝试实施定制AI系统但六个月后仍未将其扩展到试点阶段的公司。一些对实验性技术的实验没有立即奏效,这一点不应该太令人惊讶。


该数字也没有包括员工在官方试点之外使用LLM的情况。MIT研究人员发现,他们调查的公司中约有90%存在一种AI“影子经济”,工人正在使用个人聊天机器人账户。但这种影子经济的价值尚未被衡量。


当Upwork研究考察智能体与了解自己在做什么的人员合作完成任务的情况时,成功率飙升。结论似乎是,很多人正在自己摸索AI如何能帮助他们完成工作。


这与AI研究员兼网红(也是“氛围编码”一词的创造者)Andrej Karpathy所指出的相符:聊天机器人在许多不同的事情上比普通人做得更好(比如提供法律建议、修复代码错误、做高中数学题),但它们不如专家人类做得好。Karpathy认为,这可能是聊天机器人在个人消费者中如此受欢迎的原因,它们可以帮助非专家处理日常问题和任务,但它们尚未颠覆经济,因为要颠覆经济就需要胜过熟练的员工。


这种情况可能会改变。目前,不要惊讶于AI尚未(或还没有)产生拥护者所说的对就业的影响。AI不是速效药,它不能取代人类。但仍有很大的潜力有待挖掘。AI可以融入日常工作流程和业务流程的方式仍在探索之中。

03:我们身处泡沫之中吗?(如果是,是什么类型的泡沫?)

如果AI是一个泡沫,它像2008年的次级抵押贷款泡沫,还是2000年的互联网泡沫?因为它们之间存在巨大差异。


次级抵押贷款泡沫摧毁了经济的很大一部分,因为它破裂时只留下了债务和估值过高的房地产。互联网泡沫摧毁了很多公司,并在世界范围内产生了连锁反应,但它留下了初生的互联网——一个由电缆组成的国际网络和少数几家初创公司,如谷歌和亚马逊,它们成为了今天的科技巨头。


然而,也许我们正处于一个与前两者都不同的泡沫中。毕竟,目前LLM还没有真正的商业模式。我们还不知道“杀手级应用”会是什么,甚至是否会有一个。


许多经济学家担心,为建设基础设施和满足预期需求而投入的资金达到了前所未有的水平。但如果这种需求没有出现怎么办?再加上许多交易的怪异循环性——英伟达向OpenAI付费,OpenAI再向英伟达付费,等等——难怪每个人对未来都有不同的看法。

一些投资者仍然保持乐观。在11月接受《科技商业规划网络》播客的采访中,国际大型私募股权公司Silver Lake Partners的联合创始人Glenn Hutchins提出了几个不应担心的理由。“每一个这样的数据中心——几乎所有的数据中心——都有一个有偿付能力的对手方,与他们签订了合同,要接收他们所建造和适合的所有产出,”他说。换句话说,这不是“建好了就会有人来”的情况——客户已经锁定了。


而且,他指出,最大的有偿付能力的对手方之一是微软。“微软拥有世界上最好的信用评级,”Hutchins说。“如果你与微软签订了一份合同,让他们接收你数据中心的产出,萨提亚是靠得住的。”


许多首席执行官会回顾互联网泡沫并试图从中吸取教训。这是一种看待方式:当时破产的公司没有钱撑到最后。那些在崩溃中幸存下来的公司则蓬勃发展。

相关报道

牢记这一教训,今天的AI公司正试图在可能存在泡沫的时期中生存下来。保持在竞赛中;不要掉队。尽管如此,这是一场绝望的赌博。


但还有一个教训。看起来像是“支线任务”的公司可能会迅速成长为独角兽。以Synthesia为例,该公司为企业制作头像生成工具。风险投资公司Air Street Capital的联合创始人Nathan Benaich承认,几年前他第一次听说这家公司时,正值人们对深度伪造(deepfakes)的担忧四起,他不确定其技术有何用处,并认为没有市场需求。


“我们不知道谁会愿意为唇形同步和声音克隆付费,”他说。“事实证明,有很多想付费的人。”Synthesia现在约有55,000家企业客户,年收入约1.5亿美元。去年10月,该公司估值为40亿美元。

04:ChatGPT不是开端,也不会是终结

ChatGPT是深度学习(即支撑所有现代AI的技术)十年来进步的顶峰。深度学习本身的种子早在20世纪80年代就已种下。整个领域可以追溯到至少20世纪50年代。如果以这个背景来衡量进步,那么生成式AI才刚刚起步。


与此同时,研究正处于白热化阶段。世界主要AI会议的高质量投稿比以往任何时候都多。今年,一些会议的组织者不得不拒绝那些已经被审稿人批准的论文,仅仅是为了控制数量。(与此同时,像arXiv这样的预印本服务器已经被AI生成的垃圾研究淹没。)

Sutskever在Dwarkesh那次采访中说:“我们又回到了研究的时代”,他谈论的是目前LLM的瓶颈。这不是挫折;这是新事物的开始。


Benaich说:“总是有很多炒作的野兽(hype beasts)。”但他认为,炒作也有其积极的一面:炒作吸引了取得真正进步所需的资金和人才。“你知道,就在两三年前,构建这些模型的人基本上只是碰巧发现了某种有效技术的研究怪咖,”他说。“现在,所有在技术领域有才能的人都在从事这个领域的工作。”

我们接下来的方向?

这种持续不断的炒作不仅仅来自于那些为他们昂贵的新技术造势的公司。有很大一部分人——无论是在行业内还是行业外——都希望相信拥有阅读、写作和思考能力的机器的承诺。这是一个持续了几十年的宏大梦想


但炒作从未具有可持续性——而这是一件好事。我们现在有机会重置期望,将这项技术视为其本来的面目——评估其真实能力,了解其缺陷,并花时间学习如何以有价值(和有益)的方式应用它。“我们仍在努力弄清楚如何从这个高维度的信息和技能黑箱中唤起某些行为,”Benaich说。


这次炒作修正早就该来了。但请记住,AI不会消失。我们甚至还没有完全理解我们目前所构建的东西,更不用说接下来会发生什么了。



🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区