目 录CONTENT

文章目录

为 AI 代理的成功构建强大的数据基础设施

Administrator
2026-03-13 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.technologyreview.com/2026/03/10/1134083/building-a-strong-data-infrastructure-for-ai-agent-success/

原文作者:MIT Technology Review Insights


在采用 AI 并展现其价值的竞赛中,企业正以前所未有的速度部署生成式 AI,将其作为副驾驶、助手和自主任务执行者。根据麦肯锡的年度 AI 报告,2025 年末,近三分之二的公司正在试验 AI 代理,而 88% 的公司至少在一项业务职能中使用 AI,高于 2024 年的 78%。然而,尽管早期试点项目通常会成功,但只有十分之一的公司真正实现了 AI 代理的规模化部署。

一个主要问题是:AI 代理的有效性完全取决于支撑它们的数据基础。专家认为,大多数公司在实施 AI 方面遇到延迟,并非因为模型存在缺陷,而是因为它们缺乏能够为人类和代理可靠使用的、提供业务背景的数据架构。

SAP 数据与分析部门总裁兼首席产品官 Irfan Khan 表示,公司需要准备好合适的数据架构,而未来几个月乃至几年将是至关重要的。 “唯一可以可靠预测的是,我们不知道 AI 在未来几年、几个月甚至几周内会发生什么,”他说。“要立即获得快速的成功,您需要采取 AI 心态,并将您的 AI 模型建立在可靠的数据之上。”

虽然数据对企业而言一直很重要,但在 AI 时代,它将变得更加重要。生成式 AI 的能力将更多地由企业数据架构和治理的健全性决定,而较少由模型的发展决定。要实现技术的规模化,企业需要采用现代数据基础设施,在提供数据的同时提供上下文。

更多业务背景,而非更多数据

传统观念常将结构化数据视为高价值,非结构化数据视为低价值。然而,AI 使这种区分变得复杂。AI 代理的高价值数据,其定义更多地取决于业务背景,而非格式。用于关键业务功能(如供应链运营和财务规划)的数据是依赖于上下文的。虽然细粒度的、大流量的数据(如物联网、日志和遥测数据)可以产生价值,但前提是必须提供业务背景。

因此,Khan 说,生成式 AI 的真正风险不是数据匮乏,而是缺乏“基础”。

“任何具有业务背景的数据,其定义都会为您带来更大的价值和更高的业务成果可靠性,”他说。“这不像说结构化数据是高价值数据,而大量重复数据是低价值数据——两者在合适的人手中都能发挥巨大作用,这正是 AI 的不同之处。”

上下文可以通过与软件集成、现场分析和丰富化,或通过治理流程获得。缺乏这些特质的数据很可能不被信任——这也是为什么根据数据与企业 AI 研究所 (IDEA) 的数据,三分之二的商业领袖不完全信任他们的数据的原因。由此产生的“信任债务”阻碍了企业在 AI 就绪方面的努力。克服这种信任缺失需要共享的定义、语义一致性以及可靠的操作上下文来使数据与业务含义对齐。

数据蔓延需要语义化的、面向业务的层

在过去十年中,企业数据架构最重要的转变是计算与存储的分离,以及云规模的灵活性,Khan 说。然而,这种分离和向云的迁移也造成了数据蔓延,数据分散在多个云、数据湖、数据仓库以及大量的 SaaS 应用程序中。

随着企业转向 AI,这种蔓延问题并未消失。事实上,这个问题正在加剧,超过三分之二的公司将数据孤岛视为采用 AI 的主要挑战,超过一半的企业在处理 1000 个或更多数据源时遇到困难。上一时代是建立 SaaS 软件的基础——分离计算和存储并构建数据湖——而下一时代则是为负责各种业务功能的自主 AI 代理提供合适的数据。

“数据管理领域最伟大的创新可能是计算与存储的分离,”Khan 说。“但真正区分现在的是我们协调数据以及在多个内容源中挖掘数据价值的方式。”

要实现这一点,需要一个支持多平台、编码业务规则和关系的语义层或知识层,提供面向业务上下文且经过治理的数据视图,并允许人类和代理以适当的方式访问数据。但咨询公司德勤在其《企业 AI 状况》报告中指出,传统数据架构无法为未来的自主 AI 系统提供动力。只有 10% 的公司认为他们的数据管理流程已为 AI 做好准备,而去年这一比例为 43%,这表明随着企业探索 AI 部署,它们正意识到其基础设施的不足。

生成式 AI 不会取代 SaaS

一些投资者和技术专家推测,AI 代理将使 SaaS 应用程序过时。Khan 强烈反对这种观点。在过去的 15 年里,价值已稳步向上层移动,从本地基础设施到基础设施即服务 (IaaS),再到平台即服务 (PaaS),最后到 SaaS。AI 代理仅仅是下一个层次。AI 代理将拥有自己的层来访问数据并与业务逻辑交互。价值向上层移动,但底层的一切都不会消失,他说。

“SaaS 不会消失,”他说。“这仅仅意味着 SaaS 和这些代理将相互协作。公司不会扔掉他们所有的总账系统,然后用一个代理来替换它。代理会做什么?没有业务背景和业务处理,它一无所知。”

在这个新兴模型中,软件栈正在被重塑,以便应用程序和数据提供受治理的上下文,AI 可以在其中有效运行。SaaS 应用程序仍然是记录系统,而语义层成为业务上下文的真相来源。AI 代理成为一个新的交互层,跨系统进行编排,人类和代理都成为访问业务逻辑的“一等公民”,他说。

至关重要的是,代理无法直接连接到每个运营系统。“如果我们说代理将接管世界……您不能让一个代理与每个后端运营系统对话,”Khan 警告说。“事情就是这样运作的。”

这进一步提升了语义层或业务连接层的重要性。

从何开始

大多数企业需要从他们的数据所在的地方开始——在 Snowflake、Databricks、Google BigQuery 等平台,或者现有的 SAP 环境中。Khan 说这是正常的,但他警告不要重蹈供应商锁定等旧模式。

他建议企业通过专注于保留业务上下文并将其提供给运营和应用程序数据来优先处理最重要的数据。企业还应通过在扩展试点项目之前定义共享策略、访问规则和语义模型来尽早投资于治理和语义。最后,企业应优先考虑开放性和连接层式的互操作性,而不是将所有数据强行整合到一个堆栈中。

Khan 警告不要过早追求完全自动化。“存在一个令人兴奋的新机会,可以真正投入到代理和 AI 世界,”Khan 说。“完全自动化 [关键业务流程] 也许有点夸张,因为需要大量的额外监督。”他补充说,早期成功可能来自不太关键的流程,以及来自处理最新、有状态数据而非过时仪表板的代理。随着 AI 开始带来价值并获得更广泛的应用,领导者必须决定如何再投资这些收益以推动营收增长或进入新市场。

注册参加 2026 年 3 月 24 日的“数据与 AI 的融合”虚拟活动。聆听塑造数据与 AI 未来高管和思想领袖的见解。

此内容由 MIT Technology Review 的定制内容部门 Insights 制作。并非由 MIT Technology Review 的编辑人员撰写。它由人类作家、编辑、分析师和插画师进行研究、设计和撰写。这包括编写调查问卷以及收集调查数据。可能使用过的 AI 工具仅限于通过全面人工审查的辅助生产流程。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区