📢 转载信息
原文作者:Bob Boiko, Christopher Donnellan, Sarat Tatavarthi, Andrei Ivanovic, Enjeh Anyangwe, and Alok Singh
本文由 Condé Nast 的 Bob Boiko、Christopher Donnellan 和 Sarat Tatavarthi 联合撰写。
一个多世纪以来,Condé Nast 始终站在全球媒体的最前沿,通过其享有盛誉的品牌组合塑造文化和对话。公司成立于 1909 年,已从传统出版商发展成为现代媒体巨头。如今,Condé Nast 旗下具有影响力的品牌,如《Vogue》、《The New Yorker》、《GQ》和《Vanity Fair》,在全球拥有 7200 万印刷版读者、3.94 亿数字消费者以及 4.54 亿社交网络关注者,使其成为全球最具影响力的内容创作者和发行商之一。
公司庞大的品牌组合,横跨多个品牌和地域,要求管理日益复杂的合同、权利和许可协议网络。现有流程严重依赖对新摄入合同的手动审查,尤其是在品牌收购或扩张等战略举措期间。权利管理专家花费大量时间识别传入合同并将其与现有模板进行匹配、提取授予的权利和元数据,以及管理来自全球贡献者的各种创意资产(包括图像、视频和文本内容)的许可协议。这种手动、基于规则的方法造成了重大的运营瓶颈。该流程耗时且容易出错。因此,公司在利用权利方面采取了保守的做法,导致错失了收入机会。Condé Nast 需要一种现代、高效的解决方案,能够在保持最高准确性标准并符合法规要求的同时,实现合同处理的自动化。
在本文中,我们将探讨 Condé Nast 如何利用 Amazon Bedrock 和 Anthropic 的 Claude 来加速其合同处理和权利分析工作流程。
解决方案概述
AWS 与 Condé Nast 的法务和技术团队合作,开发了一个由 AWS AI 服务驱动的自动化合同处理解决方案,专注于解析、比较和数据可视化——并非提供法律建议本身。该解决方案使用了以下关键服务:
- Amazon Simple Storage Service (Amazon S3) – 一种可扩展的对象存储服务,用于存储传入的合同、参考模板和解决方案输出。
- Amazon OpenSearch Serverless – Amazon OpenSearch Service 的按需无服务器配置,用作向量存储。
- Amazon Bedrock – 一项完全托管的服务,通过单个 API 提供领先 AI 公司的高性能基础模型(FM)选择,以及一套广泛的功能,用于安全、私密和负责任地构建生成式 AI 应用程序。借助 Amazon Bedrock,您可以针对特定用例试验和评估顶级 FM,使用微调和检索增强生成(RAG)等技术利用您的数据对其进行私密定制,并构建使用您的企业系统和数据源执行任务的代理。
- AWS Step Functions – 一种可视化工作流服务,帮助开发人员使用 AWS 服务构建分布式应用程序、自动化流程、编排微服务以及创建数据和机器学习(ML)管道。
- Amazon SageMaker AI – 一项完全托管的 ML 服务。借助 SageMaker AI,数据科学家和开发人员可以快速构建、训练和部署 ML 模型到生产就绪的托管环境中。它提供了一个用于运行 ML 工作流程的用户界面体验,使 SageMaker AI ML 工具可在多个集成开发环境(IDE)中跨用。
关键组件如下方架构图所示。

该工作流程包含以下步骤:
- 用户将新合同上传到输入 S3 存储桶。新合同的添加会触发 Amazon EventBridge,从而启动主要的 Step Functions 工作流。
- 一个 Amazon SageMaker Processing 作业会处理合同,将其从 PDF 转换为数字文本文件。此步骤利用 Amazon Bedrock 中 Anthropic 的 Claude 3.7 Sonnet 的视觉推理能力,将 PDF(转换为图像)转录为原始文本文件。此操作在评估各个合同时会考虑手写注释、删除线和特殊文档格式(如单栏与多栏)。预处理还可以通过将大型、上百页的文档分成更小的块并重复执行上述步骤来处理。生成的文本文件保存在 S3 存储桶中,用作一系列现有和未来生成式 AI 用例的基础。中间处理数据输出受与原始源数据相同的访问限制控制。
- 使用此文本文件输出,第二个 SageMaker Processing 作业运行,利用 Amazon Bedrock 中 Anthropic 的 Claude 3.7 Sonnet 来提取一组预先指定的元数据字段。向大型语言模型(LLM)提供一个包含每个潜在元数据字段及其简短描述的提示模板,以帮助模型进行提取。
- 第三个 SageMaker Processing 作业通过将传入合同的文本与存储在 Amazon Bedrock 知识库中的可能模板的文本进行比较,来发现相似的现有模板。此外,Anthropic 的 Claude 3.7 Sonnet 会确定与最相似模板的关键语义差异。结果汇总在一个电子表格中,包括提取的元数据字段以及最相似的模板和样板文本。这些结果保存到 S3 存储桶中。系统会向相应的业务和法务人员发送通知消息,以供他们审查结果。相似度低的传入合同会被发送到单独的 S3 存储桶,用于单独的下游流程(进一步分析和生成新模板)。
- 人工审查员验证系统的结果。使用 AWS Lambda 函数,有效的结果随后会被加载到 Condé Nast 的权利和版税管理系统中。系统会发送一条通知消息,指示上一步加载的成功或失败。解决方案的输出用于一系列下游流程,与 Condé Nast 的其他内部软件解决方案集成。
- 步骤 5 中没有找到紧密匹配模板的合同会被路由以进行进一步分析。
- 这些低相似度合同被输入到聚类算法中,并根据其文本相似度和每份合同授予的权利进行分组。
- 一个包含分配的集群标签、相似度得分、合同文本等的电子表格会保存到 Amazon S3,同时附带交互式可视化。人工审查员使用这些结果来起草将用于未来交易和解决方案运行的新模板。然后,可以对可能已在步骤 4 中上传新对应模板到知识库的合同重新运行解决方案。
优势与成果
通过使用 AWS AI 服务,Condé Nast 显著改进了其权利管理运营:
- 多种模型访问 – Amazon Bedrock 通过单个 API 即可提供对各种 FM 的访问。
- 无缝集成 – Amazon Bedrock SDK 可与 SageMaker Processing 轻松协作。
- 效率大幅提升 – 合同分析的处理时间已从数周缩短到数小时,从而实现了更快的发布部署和更灵活的行业响应。这有助于权利管理专家专注于复杂案例和战略举措。
- 增强的知识可及性和用户赋权 – 该解决方案将合同分析流程系统化,极大地提高了组织范围内对权利管理专业知识的可及性。法务助理和权利专家现在可以通过将他们的专业知识编码到解决常规查询的提示中,更有效地利用他们的知识,帮助他们在保持高准确性标准的同时专注于复杂的战略事务。
- 可扩展性和灵活性 – 在高容量期间(如重大的品牌收购或扩张),该系统可以毫不费力地处理增加的工作负载,而无需额外的人力资源。这有助于在高峰需求期间也能实现一致的处理时间。
- 准确性提高 – 生成式 AI 驱动的系统对合同进行的全面分析和对细微差别的识别,显著降低了权利侵犯和潜在法律挑战的风险。这使 Condé Nast 在内容部署决策和知识产权资产保护方面更加自信。
- 附带的改进 – 该系统的实施产生了超越其主要功能的宝贵副产品和经验教训。这些见解支持了其他解决方案的开发,包括一个将复杂的权利可用性信息转换为非技术用户易懂的平实语言的系统,从而扩大了权利管理在整个组织中的效用。
经验教训
Condé Nast 实施此解决方案产生了几项关键见解,为媒体行业及其他领域的类似数字化转型项目提供了宝贵的经验教训:
- 数据预处理是基础 – 团队发现,元数据提取和后续流程的质量在很大程度上取决于初始的合同处理流程。这促使开发了一个先进的 OCR 系统,该系统能够处理各种文档类型,包括带有手写注释、扫描件和多栏 PDF 的文档。此外,系统需要有效处理大文件,无论是在文件大小还是页数上。如果没有这种复杂的预处理能力,工作流程中后续步骤的性能将受到严重影响。
- 人工监督仍然是关键 – 该项目强化了人类专业知识的价值,尤其是在复杂的数据处理任务中。团队发现,人工评估对于处理细微差别案例和为提示工程提供至关重要的反馈循环至关重要。这种“人在回路中”的方法允许持续改进 AI 模型,随着时间的推移提高其准确性和相关性。它强调了将 AI 视为增强人类智能而非完全取代它的工具的重要性。
- 以业务为中心的整合技术方法 – 该项目成功的关键因素之一是其专注于解决特定的业务问题。团队关注如何有效地组合各种生成式 AI/ML 解决方案,以应对 Condé Nast 在权利管理方面的独特挑战。这种方法确保了技术解决方案与业务目标紧密对齐,从而实现了更实用、更具即时价值的实施。
- 早期利益相关者一致 – 从项目一开始就让所有相关方(法务团队、权利管理专家和技术人员)参与进来,被证明是重要的。这种协作方法确保了解决方案满足合规性要求的同时提高了运营效率,促进了在组织内部的平稳采用。
- 增量实施 – 决定增量推出解决方案,从特定品牌的合同子集开始,实现了快速迭代和完善。这种分阶段的方法有助于团队在全面部署之前收集真实世界的反馈并进行必要的调整,从而形成更强大、更有效的解决方案。
- 参考数据质量 – 该项目强调了多样化、高质量示例文档的重要性。当系统提供跨多个品牌和地理区域的全面代表性历史合同集时,准确性得到了显著提高,突显了维护记录良好的合同档案以获取上下文和模式匹配的价值。
结论
通过与 AWS 的这次合作,Condé Nast 成功地对其权利管理工作流程进行了现代化改造,创建了一个更高效、更准确、更具可扩展性的系统。该解决方案解决了当前的运营挑战,并通过为 AI 驱动的内容管理奠定基础,为 Condé Nast 的未来增长奠定了基础。此项实施为传统媒体公司如何拥抱 AI 技术以简化运营,同时保持权利管理和法规遵从性的最高标准提供了蓝图。该解决方案的成功部署证明了 AWS AI/ML 服务在使传统合同分析业务流程现代化方面的潜力,为媒体权利管理设定了效率和准确性的新标准。
该项目的开发也在改变 Condé Nast 软件开发的方法,特别是针对生成式 AI 应用程序。通过帮助主题专家通过提示工程推动开发,该组织发现了一种更直接、更贴合业务的路径来创建技术解决方案。这种新模式有助于专家直接向语言模型以清晰的英语表达需求,从而显著减少了传统开发复杂性,同时提高了结果的准确性和相关性。这种转变重新定义了 Condé Nast 处理技术创新的方式,从传统的软件开发周期转向更具活力、由专业知识驱动的过程。
作者简介
Bob Boiko 是 Condé Nast 的首席架构师,负责规划其内容系统的未来。在加入 Condé Nast 之前,Bob 创立了三家内容系统公司,并在华盛顿大学信息学院担任教学教授。作为内容管理领域的全球领导者,他在为顶尖技术公司(包括微软、摩托罗拉和波音)设计和构建最先进的信息系统方面拥有 20 多年的经验。Bob 曾担任多个顾问委员会成员,并获得了许多奖项,包括 2005 年内容管理行业领导力 EContent 100 奖。他是《内容管理圣经》(Content Management Bible)、《嘲笑 CIO:IT 领导力的寓言与处方》(Laughing at the CIO: A parable and Prescription for IT Leadership)以及科幻小说《最后的变色龙》(The Last Chameleon)的作者。他以其讲座和研讨会而闻名国际,是一位技艺精湛的分析师、协调员、教师、设计师和架构师,在内容和信息管理系统、软件开发、用户体验和元数据系统方面拥有丰富的专业知识。
Christopher Donnellan 在出版和媒体行业拥有超过 30 年的经验,专长于知识产权、合同谈判、许可和全球权利管理。他于 2002 年加入 Condé Nast,负责开发用于权利许可和贡献者协议的可扩展系统,以促进内容在国际版本之间的共享。目前,他领导着一个从亚洲到美洲的全球团队,专注于内容许可、全球发行、权利管理和 AI 驱动的合同工作流程,以适应 Condé Nast 向 21 世纪媒体公司的演变。工作之余,Christopher 喜欢去打卡愿望清单上的旅行目的地、打网球、阅读,并与他的丈夫 Richard 以及他们的迷你雪纳瑞 Zelda 共度时光,Zelda 明确表示是它在掌管这个家。
Sarat Tatavarthi 担任 Condé Nast 的工程总监,领导高性能团队设计和交付分布式 Web 和移动应用程序。在专业角色之外,Sarat 是一位热衷的旅行者,喜欢与家人一起探索新的国家和文化。
Alok Singh 是 AWS 的高级机器学习工程师,在人工智能和机器学习领域拥有超过 11 年的经验。他专注于帮助 AWS 客户设计和部署 AWS 上的 AI/ML 工作负载和解决方案。在过去的 3 年里,他一直致力于帮助客户大规模部署生成式 AI 解决方案。他拥有数据科学硕士学位和电子与电信学士学位。
Andrei Ivanovic 是 AWS 专业服务的数据科学家,在交付内部和外部解决方案方面拥有经验,涵盖生成式 AI、计算机视觉、ML、时间序列预测和地理空间数据科学。Andrei 拥有多伦多大学计算机科学硕士学位,曾在深度学习、机器人学和自动驾驶的交叉领域担任研究员。工作之余,他喜欢文学、电影、力量训练以及与亲人共度时光。
Enjeh Anyangwe 是 AWS 专业服务的技术参与经理,负责领导战略客户转型和开发企业交付框架。她专注于管理复杂的 AWS 项目、指导跨职能团队,并在受监管行业中建立技术交付策略。她的工作涵盖了财富 500 强公司在 AI/ML 实施、迁移、数据现代化和并购技术集成方面的项目管理领导工作。她与 AWS 现场销售、售前和支持团队合作,推动客户采用 AWS 服务。Enjeh 拥有康涅狄格大学商学院 MBA 学位,专攻运营与 IT 管理。工作之余,Enjeh 喜欢旅行、探索新文化以及与亲人共度美好时光。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区