目 录CONTENT

文章目录

为什么AI研究人员正在转向“具身智能”,以及这与我们日常生活的关联

Administrator
2025-11-08 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.bbc.com/news/articles/c1wl5wj39zjo?at_medium=RSS&at_campaign=rss

原文作者:BBC News


具身智能(Embodied AI)——让机器人和人工智能系统能够通过与物理世界交互来学习——正在成为人工智能领域最热门的研究方向之一。


对于许多人工智能(AI)研究人员来说,当前的AI模型,如ChatGPT,虽然在语言处理方面表现出色,但它们仍然“受困于屏幕”。它们缺乏对物理世界,即真实世界的理解。


这促使研究人员转向具身智能,这个领域的目标是创建能够感知、推理并采取行动的AI系统。


麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的研究科学家詹姆斯·李(James Lee)解释了这种转变背后的原因。


从虚拟到物理


具身智能的核心在于“具身性”——即AI系统需要拥有一个身体,无论是机器人还是模拟环境中的代理,以便与真实世界进行互动。


詹姆斯·李表示:“目前的语言模型在处理语言方面做得很好,但它们并没有真正体验过世界。它们没有身体,没有触觉,也没有物理约束。”


他解释说,当一个AI模型学习“拿起一个杯子”时,它通常是通过阅读数百万本书籍或网页上的描述来学习的。而具身智能体则需要通过试错来学习,这涉及到物理学的基本知识,比如重力、摩擦力和物体的形状。


“只有通过与世界互动,AI才能真正获得我们所说的‘常识’,”李先生说。


许多人工智能的重大突破,如大型语言模型(LLMs),是在高度受控的、数字化的环境中实现的,例如通过互联网上的文本和图像数据进行训练。


然而,研究人员认为,要让AI在实际应用中发挥更大的作用,它们必须能够处理现实世界的复杂性和不确定性。


一个机器人手臂正在一个似乎是工厂或仓库的环境中操作物品,展示了具身智能在工业应用中的潜力。

具身智能的挑战


将语言模型“具身化”是一个巨大的技术挑战。这不仅需要强大的硬件(如先进的机器人技术),还需要新的学习范式。


现有的机器人技术通常需要大量的人工编程来指导它们执行特定任务,比如组装零件或包装包裹。


具身智能的目标是让机器人能够像人类一样学习新任务,只需要简单的指令或观察即可。


李先生提到:“我们希望机器人能够适应变化。如果环境中的某个物体稍微移动了位置,一个传统的机器人可能会失败,但一个具身智能体应该能够适应并继续工作。”


要实现这一点,AI需要能够处理来自多个传感器(如摄像头、触觉传感器)的输入,并将这些信息整合成对周围环境的连贯理解。


现实世界的应用


具身智能一旦成熟,其应用潜力是巨大的,尤其是在那些对劳动力短缺敏感的行业。


制造业和物流业是显而易见的受益者。能够适应工厂环境、执行复杂组装任务或分拣货物的智能机器人,可以显著提高效率并降低成本。


研究人员还在探索更贴近日常生活的应用,例如家庭辅助机器人。


“想象一下一个能够理解‘请把厨房弄干净’这样模糊指令的机器人,”李先生说。“它需要知道‘干净’的含义,理解厨房的布局,并知道如何操作吸尘器或洗碗机。这是纯语言模型无法做到的。”


一个家用机器人助理正在与人类互动,展示了具身智能在家庭环境中的应用前景。

下一代AI


虽然这项技术还处于早期阶段,但行业巨头和初创公司都在大力投资。


一些公司正在使用模拟环境(如Isaac Sim或Habitat)来训练具身智能体。这些模拟器提供了逼真的物理引擎,允许AI在不损坏昂贵硬件的情况下,安全地进行数百万次的尝试和错误。


李先生总结道:“具身智能代表了AI从理论到实践的重大飞跃。我们正在从创建能‘思考’的AI,转向创建能‘行动’和‘体验’的AI。这不仅关乎更聪明的机器人,更关乎如何让AI系统真正理解我们生活的物理世界。”


随着AI向更强大的通用智能迈进,具身智能被视为连接当前数字AI能力与未来物理世界交互的关键桥梁。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区