📢 转载信息
原文作者:Databricks Blog
在当今的企业环境中,拥有一个统一的数据湖仓对于激活数据至关重要。借助湖仓,组织可以将一个被动的数据存储库转变为一个动态的、智能的引擎,它能够预测需求、自动化专业知识并驱动更明智的决策。在Edmunds,这一优先事项促使我们启动了 Edmunds Mind 项目,这是我们在Databricks数据智能平台上直接构建一个复杂的多智能体AI生态系统的倡议。
这次架构演进的动力来自于汽车行业的一个关键时刻。三大趋势汇聚在一起:
- 大型语言模型(LLM)作为强大的推理引擎的兴起
- Databricks等平台的可扩展性和治理能力作为一个安全基础
- 用于编排自动化的强大代理框架的出现。这些因素共同促成了几年前还看似不可想象的系统的诞生
这次转型不仅仅是增加另一个AI工具,更是从根本上重新设计我们的组织,使其成为一个AI原生的组织。下面是我们详细介绍该智能核心的原则、组件和策略的架构蓝图。
“Databricks为我们提供了一个安全、受治理的基础,可以运行GPT-4o、Claude和Llama等多个模型,并随着我们需求的变化切换提供商,同时保持成本可控。这种灵活性使我们能够更快地自动化评论审核并提高内容质量,从而使购车者能更快地获得可信赖的见解。”—Gregory Rokita, 技术副总裁, Edmunds
从数据丰富到洞察驱动的转变
我们的愿景是从一个数据丰富的公司发展成为一个洞察驱动的组织。我们利用AI来构建行业中最值得信赖、最个性化和最具预测性的购车体验。
这通过四个关键的战略支柱得以实现:
- 规模化激活数据: 从静态仪表板转向与数据的动态、对话式交互。
- 自动化专业知识: 将我们领域专家的宝贵逻辑编入可重用的自主智能体中。
- 加速产品创新: 为我们的团队提供一套智能智能体工具包,以构建下一代功能。
- 优化内部运营: 通过自动化复杂的内部工作流程来提高显著的效率。
我们愿景的核心是我们最重要的竞争优势:Edmunds数据护城河(Data Moat)。这个强大的汽车数据基础以我们行业领先的二手车库存、最全面的专家评论集以及一流的定价智能为代表,辅以广泛的消费者评论和新车列表。整个生态系统都在我们的Databricks环境中统一和管理,形成了一个单一的、强大的资产。Edmunds Mind正是我们为释放其全部潜力而构建的引擎。
数字智能体框架内部

Edmunds Mind的架构是一个分层、认知的系统,旨在实现复杂性、学习和规模化,其基础是Databricks平台。
智能体层级:数字专家的组织
我们将系统设计为模仿一个高效的组织结构,使用一个分层结构,任务被分解和委派。这与现代框架(如Databricks Agent Bricks)中的编排器模式完美契合。
- 主管智能体(Supervisor Agents): 战略领导者。它们执行长期规划、管理依赖关系,并编排复杂的、多阶段的任务。
- 经理智能体(Manager Agents): 团队负责人。它们协调一组专业智能体来完成一个特定、明确定义的目标。
- 工作智能体和专业智能体(Worker and Specialized Agents): 这些是个体贡献者,提供专业知识。它们是系统的“主力军”,包括不断增长的专家阵容,例如知识助手(Knowledge Assistant)、DataDave以及各种精灵(Genies)。
智能体间的通信由标准化协议管理,确保任务委派和数据交接是有结构、有类型且可审计的,这对在规模上保持可靠性至关重要。
该层级结构还被设计为能够优雅地处理故障。当一个经理智能体确定其专家团队无法解决任务时,它会将整个任务上下文(包括失败的尝试记录在其情景记忆中)升级回主管。主管可以采用不同的策略重新规划,或者,至关重要的是,将此标记为一个需要人工干预以开发新功能的新颖问题。这使得系统健壮且成为一个学习工具,帮助我们识别其能力的边界。
深入探讨 1:自动化数据丰富工作流程
历史上,解决车辆数据不准确性(例如车辆详情页面上错误的颜色)是一个劳动密集型过程,需要跨多个团队进行手动协调。如今,Edmunds Mind AI生态系统几乎实时地自动化和解决了这些挑战。这种运营效率是通过我们集中的模型服务实现的,它将我们多样化的AI智能体能力整合到一个单一的、连贯的环境中,该环境根据需求自动扩展。这种架构使我们的团队摆脱了运营开销,使他们能够专注于快速为用户交付价值。
解决方案是通过一个受治理的多智能体工作流程执行的。当用户或自动化监控程序标记出潜在的数据差异时,主管智能体立即对事件进行分类。它评估问题,将其路由到适当的专业团队,并通过Unity Catalog验证任务权限,以实现强大的数据治理。然后,一个专用的经理智能体编排一系列专业工作智能体来执行任务,这些任务从VIN解码、图像检索到AI驱动的颜色分析和最终的数据库更新。人工数据管理员仍然是关键审查的组成部分,他们的重点从手动干预转向高价值的批准阶段。每一次交互和决策都会被系统地记录下来,为持续学习和未来流程优化打下全面的基础。
这个例子说明了整个生态系统如何端到端地处理真实的数据质量和丰富化任务。
- 事件触发: 用户投诉或自动化监控程序标记出车辆描述页面上潜在的数据质量问题(例如,错误的车辆颜色)。
- 分类和编排: 主管智能体摄取事件,创建一个可跟踪的任务,并根据预定义的业务规则评估其优先级。
- 委派给经理: 主管在确认其在Unity Catalog中访问和修改车辆数据的权限后,将任务委派给车辆数据经理智能体。
- 协调的任务执行: 经理智能体编排一系列专业工作智能体来解决问题:一个VIN解码智能体、一个用于从我们的媒体库中提取照片的图像检索智能体、一个用于从图像中确定正确颜色的AI驱动颜色分析智能体,以及一个用于更新车辆构建数据库的数据更正智能体。
- 人在回路(Human-in-the-Loop)审查: 在更改上线之前,经理智能体会标记自动更改,并通过Slack集成通知人工数据管理员进行最终验证。
- 学习和关闭: 一旦管理员批准任务,主管就会将其标记为完成。整个交互——包括最终的人工批准——都会被跟踪并记录到长期记忆中,以供未来学习和审计。
深入探讨 2:知识助手:实时答案,可信赖的品牌声音
过去,客户需要浏览多个Edmunds仪表板或联系Edmunds支持才能获得答案,而现在,知识助手通过利用Edmunds全部数据,提供即时、对话式的响应。这个RAG智能体经过微调,以符合Edmunds的品牌声音,将专家和消费者评论、车辆规格、媒体和实时定价的见解编织在一起。因此,客户获得了更快、更满意的交互体验,支持人员花费在处理基本请求上的时间也更少。
关键功能包括:
- 品牌声音拟人化: 该智能体经过精心调整,以Edmunds客户几十年来所熟悉的生动、乐于助人和值得信赖的声音进行交流。
- 实时数据综合: 在一个查询中,助手可以从我们分散的实时数据源中检索、综合和呈现信息,包括专家和消费者评论、车辆规格、转录的视频内容以及最新的定价和激励措施。
- 高级RAG能力: 我们正在与Databricks合作,利用Vector Search来扩展我们的RAG实施。我们专注于增强内容的时效性优先级和复杂的元数据过滤,以确保最相关和最新的信息始终最先显示。
深入探讨 3:DataDave的“生成与批判”工作流程
DataDave现在处理复杂的分析,这些分析过去需要耗费大量时间的人工工作。该智能体编排了一个严格的工作流程,每个阶段都由一个专业智能体进行批判,以在最具挑战性的查询上实现 95% 的准确率。DataDave可以通过综合网站流量和人口统计数据,主动识别机会(例如,向Edmunds销售团队标记服务不足的经销商)。这使Edmunds的管理层能够自信地从报告“发生了什么”转变为决定“我们接下来应该做什么”。

内部工作流程是一个由分类、规划、代码生成、执行和综合组成的五阶段过程,其中一个批判智能体验证每个阶段的输出。DataDave的真正威力不仅仅在于分析内部指标,而在于它能够将我们的专有数据与广义的世界知识相结合,生成战略建议。例如,通过关联Edmunds的网站流量数据与地理和人口统计数据,DataDave可以识别服务不足地区的经销商,并主动向我们的销售团队推荐它们作为“唾手可得的成果”。
深入探讨 4:定价专业化
在Edmunds,我们遵循一个核心原则:价格不仅仅是一个数字;它是一个结论,需要背景和理由才能让人信任。利用我们在美国市场最准确定价方面的声誉,我们的智能体架构旨在以规模化提供这种信心。
我们从一个单体的“定价专家”演变为一个协调的专家团队的经验证明了这一原则。这个团队——由一个经理智能体编排,并包括诸如市场价值智能体、折旧智能体和交易评级智能体等专家——产生的不仅仅是一个标价。最终输出是一个全面的、情境化的定价故事,解释了为什么一辆车的价值是特定的。
这使得我们的定价分析师的角色从手动数据聚合转变为战略监督和指导。通过利用Databricks Agent Bricks,我们的定价统计学家可以以有限的编码来配置这些分层的智能体团队,极大地提高了他们的生产力并降低了维护开销。这使他们能够专注于真正重要的事情:数字背后的“为什么”。
认知核心:复利智能的架构
我们迈向真正智能的AI生态系统的旅程始于一个实际的挑战。在为业务分析部署像DataDave这样的专业智能体时,我们发现它们揭示了关键的、时间敏感的业务真相,但这些真相却被隔离在其操作环境内。例如,一个智能体可能会检测到关键营销渠道的异常下降趋势,但这个重要的见解需要有效地传达给其他实体(包括智能体和人类),以触发协调的响应。这凸显了一个基本需求:一个可以捕获这些新兴学习并使其可作为整个智能体系统输入共享的记忆系统。我们设想了一个认知层,其中这种知识可以积累、增长,并被利用,以使我们的整个生态系统变得越来越智能。因此,我们最新的想法和设计如下。
- 情景记忆(“发生了什么”): 每次智能体操作和观察的高保真日志,作为系统的“基本事实”。
- 语义记忆(“学到了什么”): 一个向量索引,包含从情景事件中综合出的概括性见解和成功策略。这将是可操作知识的库。
- 自动化记忆整合: 一个后台“反射器(Reflector)”智能体定期审查情景记忆,以识别并将关键学习内容整合到语义记忆中。
- 分层记忆访问: 更高级别的智能体可以访问其下属的记忆,允许经理智能体分析团队表现并优化未来策略。这个反馈循环是系统反脆弱性的核心;层级结构升级的每一次新颖失败不仅仅是一个有待解决的问题,而是一个训练整个生态系统的信号,使其变得越来越智能和有弹性。
实施:mem0 + Databricks
我们的实施将由Databricks Vector Search提供支持,使用Delta Sync Index,它与 mem0 接口完全兼容。鉴于 mem0 与向量数据库交互,我们将在同一个强大的后端中存储情景记忆和语义记忆,从而实现创新。原始的、未总结的事件(“发生了什么”)和综合的学习(“学到了什么”)将作为不同的向量类型共存于同一个源Delta表中,然后该表会自动无缝地填充到Vector Search索引中。
这种统一的架构创建了一个高效的工作流程。反射器智能体可以查询索引以获取最近的情景条目,执行其综合,并将新的、概括性的语义向量写回源Delta表。Delta Sync Index然后会自动摄取这些新学习内容,使其可供查询。通过将源Delta表用作单一入口点,我们消除了数据管道的复杂性,并获得了真正智能的智能体系统所需的可扩展、无服务器和低延迟基础。
使用Edmunds Pulse的示例工作流程
- 记录: “DataDave”智能体检测到销售异常并将其事件记录到其通过mem0 API维护的情景记忆中。此操作将一个新的向量条目写入我们的源Delta表。
- 综合: 反射器智能体处理此事件,生成一个概括性见解(例如,“X产品销量在周末下降”),并将其转换为向量嵌入。
- 索引: 新的见解被写回源Delta表,但标记为综合学习。Databricks Vector Search自动同步此新条目,将其索引到语义记忆中。
- 交付: 最后,一个专用的Edmunds Pulse智能体持续监控语义记忆中的高优先级智能,并将此综合发现主动交付给人工利益相关者。与旨在提供更环境化、更具感知力的AI助手的ChatGPT Pulse发布相呼应,我们的Edmunds Pulse将充当业务的实时“脉搏”,确保关键见解不仅被存储,而且被积极传达,以驱动及时和智能的行动。
数据和知识层:受治理的真相基础
AI智能体依赖于其数据的质量。Edmunds数据层专为一致性、治理和灵活性而构建,以Unity Catalog作为基石,确保所有信息保持准确和管理良好。
深入探讨 5:GraphQL数据访问和交互模式
Edmunds模型上下文协议(MCP)框架安全地将AI智能体与所有核心数据源(如车辆规格、评论、库存以及New Relic等系统的运营指标)的实时上下文连接起来。这是通过一个统一的GraphQL API网关实现的,该网关抽象了底层复杂性,并提供了一个强类型的、自文档化的Schema。
系统不再让智能体或工程师受制于碎片化的数据、不匹配的Schema或缓慢的故障排除,而是支持三种主要的交互模式,每种模式都针对不同的用例进行了微调:
- 动态Schema自省(Dynamic Schema Introspection): 智能体可以通过自省GraphQL Schema本身来动态探索新奇或不熟悉的查询。当客户提出一个独特的问题——例如汽车的价值是否受到近期安全召回的影响时——智能体可以即时发现新的数据类型并制定精确的查询来获取相关答案。这种灵活性使组织无需手动更改API就能快速适应新的业务需求。
- 粒度映射工具(Granular Mapped Tools): 每个智能体工具都直接映射到特定的GraphQL查询或突变,以实现常规操作。例如,更新车辆颜色就像提取VIN和新颜色一样简单,智能体负责处理突变。这种方法提高了可靠性并减少了手动干预,简化了日常团队任务。
- 持久化查询(Persistent Queries): 高流量、性能关键的功能,例如实时库存仪表板,利用预先注册的查询来实现最高效率。智能体发送一个轻量级的哈希和变量,系统会立即返回结果,从而减少了带宽并增强了安全性。
通过单一、强大的API层为AI智能体提供结构化的业务数据访问,Edmunds极大地提高了产品和支持职能中数据操作的速度、灵活性和可靠性。过去需要定制开发或跨团队调试的任务现在可以实时处理,使客户和内部团队能够从更丰富的见解和更敏捷的响应中受益。
深入探讨 6:语义层和知识层
这一关键层是原始数据与智能体理解之间的桥梁。它抽象了底层数据存储的复杂性。它用业务上下文丰富数据,确保智能体在Edmunds宇宙中一致、受治理且易于理解的视图上运行。
- Unity Catalog:治理骨干: 作为我们数据生态系统的核心,Unity Catalog为所有数据和AI资产提供了集中治理、安全和血缘关系。它确保由智能体访问的每一块数据都受到细粒度访问控制的约束,并且其路径是完全可审计的,构成了安全合规AI平台的不可协商的基础。
- 产品语义层:实时业务上下文: 该层为智能体提供了一个关于我们的核心产品实体(例如,车辆、经销商、评论)的实时、面向对象的视图。关键在于,它直接来源于为Edmunds网站提供支持的GraphQL Schema。这确保了绝对的一致性;当一个智能体讨论一个“车辆”时,它引用的是与消费者在网站上看到的相同数据模型和业务逻辑,从而消除了外部产品与内部AI之间数据漂移的任何风险。
- 分析语义层:KPI的单一事实来源: 该层提供了所有业务绩效指标的一致且可信赖的视图。它直接来源于我们精心整理的Delta Metric Views,这也是为所有高管和运营仪表板提供数据源。这种对齐保证了,当DataDave或其他智能体报告业务KPI(如会话流量、潜在客户或评估率)时,它们使用与我们既定的商业智能工具完全相同的定义和数据源,确保了组织内部的单一事实来源。
- Databricks Vector Search - RAG的引擎: 此组件是我们非结构化和半结构化数据的高性能检索引擎。通过将我们大量的评论、文章和转录内容转换为向量嵌入,我们使像知识助手这样的智能体能够执行闪电般的语义搜索,在检索增强生成(RAG)模式中检索最相关的上下文来回答用户查询。
从成本中心到价值引擎:衡量我们的AI投资回报率
一个有远见的架构的好坏取决于其执行情况。我们的方法基于一个分阶段的路线图,并坚定致力于将我们的AI生态系统视为一个核心的、创造价值的引擎。我们通过将我们的技术框架(用于可观测性、治理和道德)与关键业务成果直接挂钩来实现这一目标。我们的目标不仅仅是构建强大的AI;而是要量化其对我们底线的影响。
加速业务速度
我们构建了一个全面的系统来衡量ROI的双方。在回报方面,我们的框架将AI性能直接与业务KPI联系起来。例如:
- 我们的 DataDave 智能体在几分钟内提供复杂、可操作的分析,而这在过去需要人工Edmunds分析师数小时才能完成。这极大地加速了数据驱动的决策制定。
- 我们的定价智能体即时响应查询,消除了数小时的手动研究,使我们的团队能够专注于战略性的、高价值的工作。
虽然我们仍在量化对活动转化率等指标的确切影响,但该框架提供了绘制这些关联所需的实时数据。
成本优化
我们通过AI网关实践精明的经济治理。高风险的智能体如DataDave被路由到我们最强大的模型以确保准确性,而例行任务则自动分配给更具成本效益的模型。这种模型分层策略使我们能够精确管理我们的LLM和计算支出,确保每一笔投资都与它所创造的业务价值相匹配。
“Databricks使我们能够安全、规模化地为正确的任务运行正确的模型。这种灵活性为我们的智能体提供动力,并带来更智能的购车体验。” — Greg Rokita, 技术副总裁, Edmunds
组织赋能:赋能每一位员工
为了实现这一愿景,我们正在Edmunds内部培养一种创新文化。我们的目标是支持从完全自主任务到人在回路审查和完全协作解决问题的全光谱人机交互。
为了支持这一点,我们为工程师提供了一个强大的智能体SDK,并通过我们的Agent Bricks平台倡导“公民开发者”运动。这项倡议始于我们公司范围内的“Edmunds AI智能体”技术会议,并通过一个活跃的LLM智能体公会来培育,确保每位员工都拥有工具和支持,为我们由AI驱动的未来做出贡献。
前路漫漫:从主动智能到真正的自主性
我们成为一个真正的AI原生组织的旅程是一场马拉松,而不是短跑。“Edmunds Mind”架构是我们的蓝图,其下一个演化步骤是开发主动智能体,它们不仅能回答问题,还能预见业务需求。我们设想的未来是我们的智能体能够从实时数据流中识别市场机会,并在利益相关者提出要求之前就向他们提供战略见解。
最终,我们的路线图通向一个智能体可以自我优化的系统——提出新工具、改进批判机制,甚至建议架构改进。这标志着从我们简单操作的系统向一个真正的认知伙伴的转变,将我们的角色从操作员转变为新智能劳动力的监督者、伦理学家和战略家。
了解更多关于Edmunds如何在Databricks的帮助下构建AI驱动的购车体验。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区