📢 转载信息
原文链接:https://www.technologyreview.com/2026/01/22/1131661/yann-lecuns-new-venture-ami-labs/
原文作者:Caiwei Chen
图灵奖得主、顶级AI研究员杨立昆(Yann LeCun)长期以来一直是科技界的逆向思考者。他认为,业界当前对大型语言模型(LLM)的痴迷是本末倒置的,并最终将无法解决许多紧迫的问题。
相反,他认为我们应该押注于世界模型(world models)——一种能够准确反映真实世界动态的不同类型的AI。他也是开源AI的坚定倡导者,并批评OpenAI和Anthropic等前沿实验室采取的闭源做法。
因此,他最近离开Meta(他曾担任该公司有影响力的研究实验室FAIR的首席科学家,并由他创立)也就不足为奇了。Meta在开源模型Llama方面进展不力,并经历了内部动荡,包括备受争议地收购ScaleAI。
杨立昆在巴黎的公寓接受了《麻省理工科技评论》的独家线上采访,讨论了他的新事业、离开Meta后的生活、人工智能的未来,以及他为何认为业界正在追逐错误的方向。
以下问答经过编辑,以求清晰和简洁。
您刚刚宣布了一家名为Advanced Machine Intelligence (AMI) 的新公司。请谈谈它背后的宏大构想。
它将是一家全球性公司,但总部设在巴黎。它的发音是“ami”,在法语中意为“朋友”。我感到非常兴奋。欧洲拥有非常高的人才集中度,但他们并不总能获得适当的环境来茁壮成长。而且,业界和政府对一个既不是中国也不是美国的可靠前沿AI公司有着巨大的需求。我认为这对我们有利。
所以,这是对我们目前拥有的中美二元对立的一种雄心勃勃的替代方案。您为什么要追求第三条道路?
嗯,很多国家都有主权问题,他们希望对AI有一定的控制权。我提倡的观点是,AI将成为一个平台,而大多数平台最终都会走向开源。不幸的是,这并不是美国行业目前的发展方向。对吗?随着竞争加剧,他们觉得必须保持秘密。我认为这是一个战略性错误。
相关报道
DeepSeek 如何颠覆了AI玩法——以及为什么所有人都将效仿
这对于从非常开放转向非常封闭的OpenAI来说确实如此,而Anthropic一直都很封闭。谷歌则稍微开放一些。至于Meta,我们拭目以待。我的感觉是,目前的方向并不积极。
与此同时,中国完全拥抱了这种开放方式。因此,所有领先的开源AI平台都来自中国,结果是,美国以外的学术界和初创公司基本上都采用了中国的模型。这没什么大不了的——你知道,中国的模型很棒。中国的工程师和科学家也很出色。但是,如果你想象一下未来,我们所有的信息摄入都是由AI辅助调节的,而选择要么是来自美国附属的专有公司的英语模型,要么是中国模型(这些模型可能是开源的,但需要进行微调,以便它们能回答关于1989年天安门广场的问题)——你知道,那不是一个令人愉快和引人入胜的未来。
它们应该能够被任何人微调,并产生高度多样化的AI辅助,具有不同的语言能力、价值体系、政治偏见和兴趣中心。你需要高度多样化的辅助,就像你需要多样化的媒体一样。
这当然是一个引人注目的观点。到目前为止,投资者是如何接受这个想法的?
他们非常喜欢。许多风险投资家非常支持开源这个想法,因为他们知道,对于很多小型初创公司来说,它们确实依赖于开源模型。它们没有资源来训练自己的模型,而且在战略上拥抱专有模型对它们来说是危险的。
您最近离开了Meta。您如何看待这家公司和马克·扎克伯格的领导力?有一种看法认为Meta已经错失了其AI优势。
我认为FAIR(杨立昆在Meta的实验室)在研究部分非常成功。Meta不太成功的地方在于将这项研究转化为实用的技术和产品。马克做出了他认为对公司最有利的选择。我可能不同意他所有的选择。例如,FAIR的机器人部门被裁撤,我认为这是一个战略失误。但我不是FAIR的主管。人们理智地做决定,没有必要感到沮丧。
所以,没有宿怨?Meta会成为AMI的未来客户吗?
Meta可能是我们的第一个客户!我们拭目以待。我们正在做的工作与他们的工作没有直接竞争。我们对物理世界世界模型的关注点与他们对生成式AI和LLM的关注点非常不同。
在LLM成为主流方法之前,您已经从事AI研究很长时间了。但自从ChatGPT横空出世后,LLM几乎成了AI的代名词。
是的,我们将改变这一点。AI的公众形象可能主要集中在LLM和各种聊天机器人上。但最新的那些并不是纯粹的LLM。它们是LLM加上很多东西,比如感知系统和用于解决特定问题的代码。所以我们将看到LLM在系统中扮演一点“编排者”的角色。
在LLM之外,有大量的AI在幕后运行着我们社会的一大部分。汽车中的辅助驾驶程序、快速的MRI图像、驱动社交媒体的算法——这些都是AI。
您一直直言不讳地认为LLM只能带我们走这么远。您认为如今LLM是否被过度炒作了?您能为我们的读者总结一下您认为LLM不够充分的原因吗?
从某种意义上说,它们没有被过度炒作,因为它们对很多人来说非常有用,特别是如果你撰写文本、做研究或编写代码的话。LLM非常擅长处理语言。但是人们产生了一种错觉,或者说妄想,认为只要将它们扩展规模就能达到人类级别的智能,这纯粹是错误的。
真正困难的部分是理解真实世界。这就是莫拉维克悖论(Moravec's Paradox,计算机科学家汉斯·莫拉维克在1988年观察到的一个现象):对我们来说容易的事情,比如感知和导航,对计算机来说却很难,反之亦然。LLM仅限于文本的离散世界。它们无法真正推理或规划,因为它们缺乏对世界的模型。它们无法预测其行为的后果。这就是为什么我们还没有像家猫一样敏捷的家用机器人,或者一辆完全自主的汽车。
我们将拥有具有类人或人类级别的智能的AI系统,但它们不会建立在LLM之上,这也不会在未来一两年内发生。这需要一段时间。在我们拥有具有人类级别智能的AI系统之前,必须发生重大的概念突破。这正是我一直在研究的,而这家AMI Labs公司正专注于下一代技术。
您的解决方案是世界模型和JEPA架构(JEPA,即“联合嵌入预测架构”,是杨立昆在Meta工作时创建的一个训练AI模型理解世界的学习框架)。请用电梯游说的方式介绍一下。
世界是不可预测的。如果你试图构建一个预测未来每一个细节的生成模型,它将会失败。JEPA不是生成式AI。它是一个能很好地学习表示视频的系统。关键在于学习世界的抽象表示,并在该抽象空间中进行预测,忽略那些无法预测的细节。这就是JEPA的作用。它通过观察学习世界的底层规则,就像婴儿学习重力一样。这是常识的基础,也是构建能够在现实世界中推理和规划的真正智能系统的关键。到目前为止,最令人兴奋的工作来自学术界,而不是那些深陷LLM世界的工业巨头。
缺乏非文本数据一直是推动AI系统进一步理解物理世界的一个难题。JEPA是通过视频进行训练的。你们还会使用哪些其他类型的数据?
我们的系统将使用视频、音频和各种传感器数据进行训练——而不仅仅是文本。我们正在处理各种模态的数据,从机器人手臂的位置到激光雷达数据和音频。我还参与了一个项目,使用JEPA来模拟复杂的物理和临床现象。
您对世界模型设想了哪些具体的、现实世界的应用?
应用是巨大的。想象一下复杂的工业流程,其中有数千个传感器,比如在喷气发动机、钢铁厂或化工厂中。目前没有任何技术可以为这些系统建立一个完整、整体的模型。世界模型可以从传感器数据中学习这一点,并预测系统的行为方式。或者想象一下智能眼镜,它可以观察你在做什么,识别你的动作,然后预测你接下来要做什么来协助你。这才是最终使具身智能系统(agentic systems)可靠的关键。一个旨在对世界采取行动的具身系统,如果没有世界模型来预测其行为后果,就无法可靠地工作。没有它,系统不可避免地会犯错。这是解锁从真正实用的家用机器人到L5级自动驾驶等一切事物的关键。
人形机器人最近非常热门,尤其是来自中国的公司制造的。您对此有何看法?
存在所有这些“硬凑”的方法来绕过学习系统的局限性,这些方法需要海量的训练数据才能完成任何事情。所以,所有能让机器人做功夫或跳舞的公司,它们的秘密都是提前规划好的。但坦率地说,没有人——绝对没有人——知道如何让这些机器人足够智能到可以派上用场。相信我。
你需要针对每项任务进行巨量的遥控训练数据,而且当环境发生轻微变化时,泛化性就非常差。这告诉我们,我们缺少非常重要的东西。一个17岁的孩子之所以能在20小时内学会开车,是因为他们已经对世界的运作方式有了很多了解。如果我们想要一个普遍实用的家用机器人,我们需要系统对物理世界有一个良好的理解。在拥有良好的世界模型和规划能力之前,这种情况是不会发生的。
有一种日益增长的观点认为,由于所需的巨大计算资源,学术界越来越难进行基础AI研究。您认为最重要的创新现在会来自工业界吗?
不会。LLM现在是技术开发,而不是研究。诚然,由于对计算、数据访问和工程支持的要求,学术界很难在其中发挥重要作用。但这已经是一个产品了。它不应该是学术界关注的焦点。这就像2010年代初的语音识别——这是一个已解决的问题,进展掌握在行业手中。
相关报道
超大规模AI数据中心:2026年十大突破性技术
学术界应该关注超越当前系统能力的长远目标。这就是我告诉大学里的人:不要研究LLM。没有意义。你无法与工业界正在发生的事情竞争。研究一些别的东西。发明新技术。突破不会来自于扩展LLM。关于世界模型最令人兴奋的工作来自学术界,而不是大型工业实验室。神经网络中使用注意力电路的整个概念最初来自蒙特利尔大学。那篇研究论文开启了整个革命。现在大公司都封闭起来了,突破的速度就会放缓。学术界需要计算资源,但他们应该专注于下一件大事,而不是完善上一件大事。
您身兼多职:教授、研究员、教育家、公众思想家……现在您又增加了一个新角色。这对您来说会是什么样子?
我将担任公司的执行主席,而Alex LeBrun(一位前Meta AI同事)将担任首席执行官。这将是LeCun和LeBrun——如果用法式发音会很悦耳。
我将保留我在纽约大学的职位。我每年教一门课,我有博士生和博士后,所以我将继续以纽约为基地。但因为我的实验室,我经常去巴黎。
这是否意味着您不会过多地亲自动手?
嗯,亲自动手有两种方式。一种是日常管理人员,另一种是真正深入研究项目,对吧?
我可以管理,但我不喜欢管理。这不是我的人生使命。我的使命是尽可能地推动科学和技术进步,激励其他人从事有趣的工作,然后为这些工作做出贡献。这便是我在Meta过去七年的角色。我创立了FAIR并领导了四到五年。我有点讨厌做总监。我不擅长这种职业管理。我更具远见和科学家的特质。
是什么让Alex LeBrun成为合适的人选?
Alex是一位连续创业者;他创办了三家成功的AI公司。第一家卖给了微软;第二家卖给了Facebook,他曾是巴黎FAIR工程部门的负责人。然后他离开去创办了Nabla,这是一家在医疗保健领域非常成功(的公司)。当我邀请他加入我们这项事业时,他几乎立即就接受了。他有构建公司的经验,这使我能够专注于科学和技术。
您的总部设在巴黎。您还计划在哪里设立办事处?
我们是一家全球性公司。北美会有一个办事处。
希望是在纽约?
纽约很棒。我正是在那里,对吧?而且它不是硅谷。硅谷有点像单一文化。
亚洲呢?我猜新加坡也会有?
可能吧,是的。让您猜猜看。
你们如何吸引人才?
我们在招聘方面没有任何问题。AI研究社区中有很多人认为AI的未来在于世界模型。这些人,无论薪酬如何,都会有动力来为我们工作,因为他们相信我们正在构建的技术未来。我们已经招募了来自OpenAI、Google DeepMind和xAI等地方的人才。
我听说,来自NYU和Google DeepMind的著名研究员Saining Xie可能会以首席科学家的身份加入您。有何评论?
Saining是一位才华横溢的研究员。我非常钦佩他。我已经雇佣了他两次。我曾在FAIR雇佣他,我也说服了我在NYU的同事在那里雇佣他。让我们这样说吧:我对他非常尊敬。
您何时准备好分享更多关于AMI Labs的细节,比如财务支持或其他核心成员?
很快——也许在二月份。我会通知您的。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区