📢 转载信息
原文链接:https://www.wired.com/story/logical-intelligence-yann-lecun-startup-chart-new-course-agi/
原文作者:Joel Khalili
如果你问Yann LeCun,硅谷存在一种群体思维问题。这位研究人员和人工智能界的权威自去年11月离开Meta以来,一直对“大语言模型(LLM)将引领我们走向通用人工智能(AGI)”这一正统观点(即计算机达到或超越人类智能的门槛)冷嘲热讽。他在最近的一次采访中宣称,所有人都被“LLM洗脑了”。
1月21日,总部位于旧金山的初创公司Logical Intelligence任命LeCun为其董事会成员。该公司基于LeCun二十年前构想的理论,声称开发出了一种不同形式的AI,这种AI能更好地学习、推理和自我修正。
Logical Intelligence开发了一种被称为基于能量的推理模型(EBM)。LLM有效地预测序列中最可能出现的下一个词,而EBM则吸收一组参数——比如数独的规则——并在这些限制内完成任务。据创始人兼首席执行官Eve Bodnia在接受WIRED采访时介绍,这种方法有望消除错误并显著减少计算量,因为它减少了试错过程。
据Bodnia称,该公司的首个模型Kona 1.0,尽管仅在单个Nvidia H100 GPU上运行,其解决数独谜题的速度比世界领先的LLM快好几倍。(在此测试中,LLM被禁止使用可能使其“暴力破解”谜题的编码能力。)
Logical Intelligence声称是第一家构建出工作EBM的公司,EBM在此之前仅仅是学术界的空想。其目标是让Kona解决像优化电网或自动化复杂制造过程这类对错误零容忍的棘手问题。“这些任务都与语言无关。与语言背道而驰,”Bodnia说。
Bodnia预计Logical Intelligence将与AMI Labs紧密合作。AMI Labs是LeCun最近在巴黎成立的一家初创公司,正在开发另一种AI形式——所谓的“世界模型”,旨在识别物理维度、展现持久记忆并预测其行为的结果。Bodnia认为,通往AGI的道路始于这些不同类型AI的层层叠加:LLM将以自然语言与人类交互,EBM将承担推理任务,而世界模型将帮助机器人在三维空间中采取行动。
本周,Bodnia在旧金山办公室接受了WIRED的视频电话采访。以下采访已根据清晰度和篇幅进行了编辑。
WIRED:我必须问问Yann。跟我讲讲你们是如何认识的,他在指导Logical Intelligence研究中的作用,以及他在董事会中将扮演什么角色。
Bodnia: Yann在纽约大学担任教授,积累了大量的学术经验,但他多年来通过Meta和其他合作伙伴接触到了真正的工业界。他见证了两个世界。
对我们来说,他是基于能量模型和各种相关架构的唯一专家。当我们开始研究这个EBM时,他是唯一能和我对话的人。他帮助我们的技术团队在某些方向上导航。他非常、非常亲身参与。没有Yann,我无法想象我们能发展得这么快。
Yann对LLM的潜在局限性以及哪些模型架构最有可能推动AI研究向前发展持直言不讳的态度。你们的立场是什么?
LLM是一场巨大的猜测游戏。这就是为什么你需要大量的计算资源。你拿一个神经网络,把互联网上几乎所有的垃圾信息喂给它,然后试图教会它人们是如何交流的。
当你说话时,你的语言对我来说是有意义的,但这并非因为语言本身。语言是你大脑中某种存在的表现形式。我的推理发生在某种我将其解码为语言的抽象空间中。我感觉人们正试图通过模仿智能来反向工程智能。
想象一下,你去听一场讲座,教授向你展示一些基础数学知识,然后你没有去理解这个概念——比如如何乘法——而是去观察教授的语言[来学习哪个词跟随前一个词]。
为什么不关注独立于语言、不是猜测游戏的AI呢?
EBM与LLM处理任务的方式有何不同?
基于能量的模型能够自我修正。
最好的类比是攀登珠穆朗玛峰。有很多不同的路径,而且每年都会因为天气而有所不同。你必须实时评估会有多少交通流量,你还有多少氧气。
如果你是一个LLM登山者,你看不到完整的地图。你一次只朝一个方向前进,然后继续走。如果遇到一个洞,你就会跳下去,然后死亡。LLM在完成任务之前不允许偏离。
EBM是一个真正的推理模型。当你走向那座山时,你需要结合你过去的经验数据和你实时学到的东西。你能够向多个方向看,选择一个方向,如果你遇到一个洞,就尝试另一种方式。任务始终在你心中挂念。
如果不是语言,EBM的训练数据集由哪些类型的数据构成?
它可以是任何东西。
我们的模型非常小,参数少于2亿,这使我们能够非常快速地训练它。我们不是试图为所有事情制作一个模型——一个包罗万象的大脑。我们为每个单独的业务制作一个更小的模型。数据对每个客户都会有所不同。
训练与传统的LLM非常不同。我们给它部分数据,称为稀疏数据。模型能够从稀疏数据中提取完整的数据。想象一下,我向你展示如何画一只猫,然后你就能推断出如何画一只狗。我们看到了这种外推能力。
企业如何部署EBM?
我对能源领域尤其感兴趣。在实时操作中,你必须处理大量变量并相应地分配能源。现在,它只是倾倒一大批能源,其中一部分被使用,一部分没有被使用。人们在管理它,但我们可以实现自动化。
我们也对药理学感兴趣——药物发现、癌症等等。所有这些都需要复杂的数据处理。我们正在与一家最大的芯片制造商以及一家最大的数据中心进行交谈。
您是否期望Logical Intelligence与Yann在巴黎的初创公司AMI Labs(也在开发替代模型架构)互补还是竞争?
我们公司专注于构建“大脑”。AMI专注于世界模型,即你将AI置于真实世界场景中,并利用数据来导航世界并做出预测。我让他们自己来说,但我们致力于合作。
您选择不对模型Kona进行开源。这是为什么?
我们最终会考虑开源某些东西。但我对自己所创造的东西感到非常负责,在将其推向世界之前,我希望确保我能充分理解它。
这是迈向AGI的真正一步。你想问自己它有多安全,有哪些可能性,以及界限在哪里。我只是想做一个负责任的“父母”。
“AGI”这个术语现在很有分量,我相信您不会轻率使用它。您能详细说明一下为什么认为EBM代表通往AGI的途径吗?
我将AGI视为一个兼容AI模型的生态系统,以最有效、最安全的方式为世界和人民服务。这需要具备自我对齐、自我评估和规划的能力。这也意味着没有容错(幻觉)的空间。
AGI的演化有不同的阶段。我们正处于非常早期的婴儿阶段。
您目前正在寻求资金。您将如何使用这笔钱?
一切都需要规模化。这个模型需要规模化。我们想尝试不同的用例,但这需要不同的团队与不同的合作伙伴合作。
我也觉得我的工作的一部分是教育人们,存在不同形式的AI。它不必是基于文本的AI。人们说,“哦,我们正处于AI泡沫中。”但我们没有。我们正处于LLM泡沫中。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区