📢 转载信息
原文链接:https://openai.com/index/wayfair
原文作者:OpenAI
Wayfair,全球最大的家居用品零售商之一,已将OpenAI模型集成到关键的内部系统中,以大规模地改进供应商支持工作流程和产品目录质量。这项始于2024年小规模价值测试的发布,现已发展成为一个全面的生产系统,该系统减少了手动工作量,加速了决策过程,并改善了数千万种产品的整体数据质量。
Wayfair并未将生成式AI视为一项实验或单一解决方案,而是将其嵌入核心运营工作流程中。该公司首先关注复杂性和规模需求最高的地方:处理和解决供应商支持请求,以及在约3000万件商品的目录中一致地改进数万种产品属性。
解决大规模目录质量问题
Wayfair的目录团队管理着跨越近一千种不同产品类别的数千万种产品。一致且准确的产品属性标签——如颜色、材质、尺寸或特定功能——对于搜索、推荐和商品推广至关重要。
“我们的数据质量越高,我们与客户建立的信任就越多。这非常重要,因为它能帮助购物者做出正确的购买决定,直接减少因产品描述不准确而造成的昂贵返修等下游问题,”Wayfair目录营销副总监Jessica D'Arcy表示。
在引入OpenAI之前,改进标签主要依赖于供应商和客户告知Wayfair哪里出了问题。手动工作量无法跟上其规模。早期针对单个标签的定制AI模型很有效,但被证明在构建和维护上成本高昂。“我们开始为单个标签构建定制模型,技术上是可行的,”Wayfair首席机器学习科学家Carolyn Phillips说。“但当你考虑47,000个标签时,这种方法根本无法扩展。”
构建可重用的AI架构
为了超越一次性模型,Wayfair创建了一个基于单一OpenAI模型的、与标签无关的系统。“定义代理”会摄取网络和内部定义,为每个标签生成上下文含义。“真正的瓶颈不在于模型性能,”Phillips说。“而是定义和编码每个标签实际含义所需的人力时间。”这种上下文,连同Wayfair数据生态系统汇集的产品数据,会输入到一个可以跨产品类别对属性进行分类的框架中。该团队现在以一年前70倍的速度扩展模型覆盖范围以适应新属性。
该系统目前已在超过100万种产品上投入生产。第一批具有增强属性的产品已上线足够长的时间,可以衡量改进数据质量对客户旅程的影响。“当你提高属性的完整性时,这不是抽象的。你会看到它体现在SEO和PLA的绩效上——体现在客户发现产品的方式上”,Phillips说。一项受控的A/B测试显示,处理组的展示次数、点击次数和页面排名有了实质性且显著的提高。
然而,Wayfair并没有简单地将纠正产品数据的决策权交给模型。“我们的目标是建立信任,让客户对他们购买的商品完全放心,”Phillips说。该公司开发了结构化的测试,通过动手审计流程,让员工亲自检查样本以验证模型输出,并与供应商合作验证更改。现在,当数据置信度很高时,自动化系统将直接覆盖内容并通知供应商更改。而且,当未达到高标准或标签被认为风险较高时,Wayfair会在进行更改之前首先寻求供应商的确认。
用Wilma重新构想供应商支持工作流程
Wayfair与数万家供应商合作,支持他们全面的产品目录。为了管理供应商支持请求,Wayfair的员工过去会审查每一份传入的工单,手动识别供应商要完成的任务,并将问题路由给正确的内部负责人——这是一个耗时且容易出错的过程。“供应商请求并不简单,”Wayfair供应商支持和运营部门的Graham Ganssle表示。“它们涵盖数百种问题类型,没有一个员工能够真正精通所有问题。”
Wayfair向一个名为Wilma的产品添加了代理功能,以AI来增强这些工作流程。首批投入生产的功能之一是由OpenAI模型驱动的工单分类。该系统读取传入的请求,填充缺失的上下文,并将工单路由到相应的团队。Wilma的设计旨在快速部署;它构建在一个已经与OpenAI API集成的系统之上,从原型到上线大约一个月。“Wilma为员工提供了杠杆作用,”Ganssle说。“它读取工单,识别意图,从我们的数据库中填充上下文,在必要时联系供应商,并将问题导向正确的方向。”
除了路由,Wayfair还为特定的解决方案团队部署了十几个代理AI流程。例如,一个用于更换零件运营团队的助手会阅读复杂的案例历史,提出下一步操作,并建议草拟回复供人工审核。这些助手通过历史数据进行训练,因此它们会学习在特定情境下成功的模式。“模型能够综合整个旅程的上下文,这是单个员工难以做到的,”Ganssle说。“更广阔的视野有助于提高客户和供应商的满意度。”
Wayfair会跟踪AI的建议与人工代理最终决策匹配的频率——这个指标被称为“一致性率”。在每个团队内部,当一致性持续达到预定阈值时,工作流程可以从辅助(“副驾驶”)模式转变为半自动(“自动驾驶”)模式。这种分阶段的方法在推出过程中建立了信任并确保了质量控制。
“如果你一开始就没能正确地处理问题,那么下游的一切都会变慢。分类是基础。”
跨团队的可衡量影响
Wayfair报告称,自将OpenAI模型集成到内部系统以来,取得了可衡量的改进。
在目录方面,该公司减少了客户可能看到的错误或缺失产品属性标签的数量——已在Wayfair目录中最可见和最畅销的100多万种产品中修正了250万个产品标签。他们预计在未来六个月内将这一影响扩大四倍。
在供应商支持方面,分类、副驾驶和自动驾驶系统通过每月自动化41,000个工单(某些工作流程的比例高达70%)提高了吞吐量,并通过消除员工工作量中的常规手动任务缩短了周转时间。这极大地缩短了多个工作流程的解决时间,显著提升了供应商满意度,并减少了这些工作流程中的工单重新打开率。
模型提供的关于工单和供应商意图的更广泛可见性——超越了单个员工在屏幕上能看到的内容——也为满意度的提高做出了贡献。
运营方面,团队报告称:
- 更快地路由和解决复杂的供应商工单
- 提高供应商满意度
- 减少手动数据输入和分类工作
- 在无需对数百个主题拥有专业知识的情况下,扩大了问题覆盖范围
- 在发布前对目录属性有更高的信心。
Wayfair还为其约12,000名员工部署了超过1,200个ChatGPT Enterprise席位,以支持临时任务、内部问题解决和生成模型实验。
与OpenAI的长期合作
Wayfair在投资机器学习和与AI平台及LLM提供商合作以推动业务发展方面有着悠久的历史。如今,前沿模型(尤其是多模态系统)的进步正在扩展其团队能够构建的功能。这在家居零售业中很重要,因为产品是视觉的、风格化的,并且常常是主观的。
“我们对我们现在能够解决的问题范围感到兴奋,”Carolyn Phillips说。“传统的算法需要严格定义的数据集。这些模型允许我们在以前无法规模化的方式下处理模糊性和上下文。”
从早期试点到生产服务,Wayfair和OpenAI之间的关系已发展成为一种战略伙伴关系,涵盖模型选择、部署最佳实践以及更广泛的内部采用。“最宝贵的始终是思想上的伙伴关系,”Wayfair首席技术官Fiona Tan说。“这不仅仅是访问模型。这是我们一起探索新的用例,并能够快速行动。”
展望未来,员工对ChatGPT Enterprise的需求一直很强劲。Wayfair的团队认为它是一个能帮助他们加快工作速度的实用工具。
顾客的期望也在迅速变化。越来越多的购物者在日常生活中越来越习惯使用AI,他们开始期望在在线浏览、比较和购买时也能获得类似的能力。
“在家里,顾客通常找不到他们正在寻找的东西的精确词汇,”Fiona Tan说。“自然语言和多模态系统有助于弥合这一差距。”
对Wayfair的领导者来说,目标仍然是扩大内部能力的同时增强人类的专业知识。“我们正在构建一个AI融入购物旅程的世界——无论是在我们的网站上,通过客服,还是通过对话界面,”Fiona Tan总结道。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区