目 录CONTENT

文章目录

康泰纳仕如何利用 Amazon Bedrock 加速合同处理和版权分析

Administrator
2025-12-10 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/how-conde-nast-accelerated-contract-processing-and-rights-analysis-with-amazon-bedrock/

原文作者:Bob Boiko, Christopher Donnellan, Sarat Tatavarthi, Andrei Ivanovic, Enjeh Anyangwe, and Alok Singh


本文由康泰纳仕的 Bob Boiko、Christopher Donnellan 和 Sarat Tatavarthi 联合撰写。

一个多世纪以来,康泰纳仕(Condé Nast)始终站在全球媒体的前沿,通过其享有盛誉的品牌组合塑造文化和对话。公司成立于1909年,已从传统出版商发展成为现代媒体巨头。如今,康泰纳仕旗下具有影响力的品牌,如《Vogue》、《The New Yorker》、《GQ》和《Vanity Fair》,在印刷版触达7200万读者,数字消费者达3.94亿,社交网络粉丝达4.54亿,使其成为全球最具影响力的内容创作者和分销商之一。

公司庞大的品牌和地域组合,需要管理日益复杂的合同、版权和许可协议网络。现有流程严重依赖于对新摄入合同的人工审核,特别是在品牌收购或扩张等战略举措期间。版权管理专家花费大量时间识别和匹配新合同与现有模板、提取授予的权利和元数据,以及管理来自全球贡献者的图像、视频和文本内容等各种创意资产的许可协议。这种手动、基于规则的方法造成了重大的运营瓶颈。该流程耗时且容易出现人为错误。因此,公司在利用版权方面采取了保守的态度,导致错失了潜在的收入机会。康泰纳仕需要一个现代、高效的解决方案,能够在保持最高准确性标准并符合法规要求的同时,实现合同处理的自动化。

在本文中,我们将探讨康泰纳仕如何利用 Amazon Bedrock 和 Anthropic 的 Claude 模型来加速其合同处理和版权分析工作流程。

解决方案概述

AWS与康泰纳仕的法务和技术团队合作,开发了一个自动化的合同处理解决方案,该方案以AWS AI服务为核心,专注于解析、比较和数据可视化——并非提供法律建议。该解决方案使用了以下关键服务:

  • Amazon Simple Storage Service (Amazon S3) – 一种可扩展的对象存储服务,用于存储传入的合同、参考模板和解决方案输出。
  • Amazon OpenSearch Serverless – Amazon OpenSearch Service 的按需无服务器配置,用作向量存储。
  • Amazon Bedrock – 一项完全托管的服务,通过单个API提供领先AI公司的高性能基础模型(FM)选择,并提供一套广泛的功能,用于安全、私密、负责任地构建生成式AI应用程序。借助Amazon Bedrock,您可以试验和评估顶级FM以满足您的用例,使用微调(fine-tuning)和检索增强生成(RAG)等技术使用您的数据对其进行私有定制,并构建利用您的企业系统和数据源执行任务的智能体(agents)。
  • AWS Step Functions – 一种可视化工作流服务,帮助开发人员使用AWS服务构建分布式应用程序、自动化流程、编排微服务以及创建数据和机器学习(ML)管道。
  • Amazon SageMaker AI – 一项完全托管的ML服务。借助SageMaker AI,数据科学家和开发人员可以快速构建、训练和部署ML模型到生产就绪的托管环境中。它提供了一个运行ML工作流的用户界面体验,使SageMaker AI的ML工具可以在多个集成开发环境(IDE)中通用。

关键组件如下图所示。

工作流程包含以下步骤:

  1. 用户将新合同上传到输入S3存储桶。新合同的添加会触发 Amazon EventBridge,从而启动主要的Step Functions工作流。
  2. 一个 Amazon SageMaker Processing 作业处理合同,将它们从PDF转换为数字文本文件。此步骤利用Amazon Bedrock中Anthropic的Claude 3.7 Sonnet的可视推理能力,将PDF(转换为图像)转录为原始文本文件。此操作在评估各个合同时会考虑手写注释、删除线和专业文档格式(如单栏与多栏)。预处理还能通过将大文件(多达数百页)分割成更小的块并重复执行前述步骤来处理大文件。生成的文本文件保存在S3存储桶中,作为一套现有和未来生成式AI用例的基础。中间处理数据输出受与原始数据相同的访问限制约束。
  3. 使用此文本文件输出,第二个SageMaker Processing作业运行,利用Amazon Bedrock中的Anthropic Claude 3.7 Sonnet提取一组预先指定的元数据字段。向大型语言模型(LLM)提供一个通过提示模板定义的Schema,该Schema包含每个潜在的元数据字段及其简短描述,以辅助模型进行提取。
  4. 第三个SageMaker Processing作业通过将传入合同的文本与存储在Amazon Bedrock知识库中的可能模板的文本进行比较,来发现相似的现有模板。此外,Anthropic的Claude 3.7 Sonnet确定与最相似模板的关键语义差异。结果汇总在一个电子表格中,包括提取的元数据字段以及最相似的模板和样板文本。这些结果保存在S3存储桶中。系统会向相应的业务和法务人员发送通知消息,要求他们审阅结果。与模板相似度低的传入合同被发送到另一个S3存储桶,用于单独的下游流程(进一步分析和生成新模板)。
  5. 人工审阅者验证系统的结果。然后,使用 AWS Lambda 函数,有效的结果将被加载到康泰纳仕的版权和特许权使用费管理系统中。系统会发送一条通知消息,指示前一个加载的成功或失败。解决方案的输出用于一系列下游流程,与康泰纳仕的其他内部软件解决方案集成。
  6. 在第5步中未找到接近模板匹配的合同将被路由以进行进一步分析。
  7. 这些低相似度合同被输入到聚类算法中,并根据其文本和每个合同授予的权利的相似性进行分组。
  8. 一个包含分配的集群标签、相似度得分、合同文本等的电子表格也保存在Amazon S3中,以及伴随的交互式可视化。人工审阅者使用这些结果来起草新的模板,供将来的交易和解决方案运行使用。然后,可以对可能在新模板上传到第4步的知识库中的合同重新运行解决方案。

优势和成果

通过使用AWS AI服务,康泰纳仕显著改进了其版权管理运营:

  • 多种模型访问 – Amazon Bedrock可以通过单个API提供对各种FM的访问。
  • 无缝集成 – Amazon Bedrock SDK可与SageMaker Processing轻松协作。
  • 效率的巨大提升 – 合同分析的处理时间已从数周缩短到数小时,从而实现了更快速的内容部署和更灵活的行业响应。这有助于版权管理专家专注于复杂案例和战略举措。
  • 增强的知识可访问性和用户赋能 – 该解决方案使合同分析过程系统化,极大地改善了组织内部对版权管理专业知识的访问。法律助理和版权专家现在可以通过将他们的专业知识编码到解决日常查询的提示中,更有效地利用其知识,从而在保持高准确性标准的同时专注于复杂的战略事务。
  • 可扩展性和灵活性 – 在高容量时期(如重大品牌收购或扩张),系统可以轻松处理增加的工作负载,而无需额外的人力资源。这确保了即使在高峰需求期间也能保持一致的处理时间。
  • 准确性提高 – 生成式AI驱动的系统对合同的彻底分析和对细微差别的识别,大大降低了版权侵权和潜在法律挑战的风险。这使康泰纳仕在内容部署决策中更有信心,并更好地保护知识产权资产。
  • 附带改进 – 该系统的实施产生了超越其主要功能之外的宝贵副产品和经验教训。这些见解支持了其他解决方案的开发,包括一个将复杂的版权可用性信息转换为非技术用户易懂的普通语言的系统,从而扩大了版权管理在整个组织中的效用。

经验教训

康泰纳仕实施此解决方案获得了一些关键见解,为媒体行业及其他领域的类似数字化转型计划提供了宝贵的经验教训:

  • 数据预处理是基础 – 团队发现,元数据提取和后续流程的质量在很大程度上取决于初始的合同处理管道。这促使开发了一个先进的OCR系统,该系统能够处理各种文档类型,包括带有手写注释、扫描件和多栏PDF的文件。此外,系统需要有效处理大文件,无论是文件大小还是页数。如果没有这种复杂的预处理能力,工作流中后续步骤的性能将会受到严重影响。
  • 人工监督仍然是关键 – 该项目强化了人工专业知识的价值,特别是在复杂的数据处理任务中。团队发现,人工评估对于处理细微差别案例和为提示工程提供至关重要的反馈循环至关重要。这种人机协作的方法允许对AI模型进行持续改进,随着时间的推移提高其准确性和相关性。它强调了将AI视为增强人类智能而非完全替代人类智能的重要性。
  • 以业务为中心的技​​术集成方法 – 该项目成功的关键因素之一是其专注于解决特定的业务问题。团队着重于如何有效地组合各种生成式AI/ML解决方案,以解决康泰纳仕在版权管理方面的独特挑战。这种方法确保了技术解决方案与业务目标紧密对齐,从而实现了更实用、更具即时价值的实施。
  • 早期利益相关者对齐 – 从项目一开始就让所有相关方(法务团队、版权管理专家和技术人员)参与进来,被证明非常重要。这种协作方式确保了解决方案在满足合规要求的同时实现了运营效率,促进了组织内部的平稳采纳。
  • 增量实施 – 决定增量推出解决方案,从特定品牌的合同子集开始,允许快速迭代和完善。这种分阶段的方法帮助团队在全面部署之前收集真实世界的反馈并进行必要的调整,从而形成一个更强大、更有效的解决方案。
  • 参考数据质量 – 该项目突显了多样化、高质量示例文档的重要性。当系统获得了涵盖多个品牌和地域的全面代表性历史合同集时,其准确性得到了显著提高,凸显了维护记录完善的合同档案以供参考和模式匹配的价值。

结论

通过与AWS的合作,康泰纳仕成功地实现了其版权管理工作流程的现代化,创建了一个更高效、更准确、更具可扩展性的系统。该解决方案解决了眼前的运营挑战,并通过为AI驱动的内容管理奠定了基础,使康泰纳仕为未来的增长做好了准备。这一实施方案为传统媒体公司如何拥抱AI技术以简化运营,同时保持最高标准的版权管理和法规一致性提供了一个蓝图。该解决方案的成功部署证明了AWS AI/ML服务在现代化传统合同分析业务流程中的潜力,为媒体版权管理树立了效率和准确性的新标准。

该项目的开发也在改变康泰纳仕开发软件的方法,特别是对于生成式AI应用程序而言。通过帮助主题专家通过提示工程驱动开发,该组织发现了一条更直接、更符合业务需求的创建技术解决方案的途径。这种新模式有助于专家直接用自然语言向语言模型表达需求,显著降低了传统开发的复杂性,同时提高了结果的准确性和相关性。这种转变重新定义了康泰纳仕处理技术创新的方式,从传统的软件开发周期转向更具活力、以专业知识驱动的过程。


关于作者

Bob Boiko 是康泰纳仕的高级首席架构师,负责规划其内容系统的未来。在加入康泰纳仕之前,Bob 创立了三家内容系统公司,并曾任华盛顿大学信息学院的教学教授。作为内容管理领域的全球领导者,他在为顶尖科技公司(包括微软、摩托罗拉和波音)设计和构建最先进的信息系统方面拥有超过20年的经验。Bob 曾担任多个咨询委员会成员,并荣获多项奖项,包括2005年内容管理行业领导力的EContent 100奖。他是《内容管理圣经》、《嘲笑CIO:IT领导力的寓言与处方》以及科幻小说《最后的变色龙》的作者。他以其讲座和研讨会而闻名国际,是一位技艺精湛的分析师、协调员、教师、设计师和架构师,在内容和信息管理系统、软件开发、用户体验和元数据系统方面拥有丰富的专业知识。

Christopher Donnellan 在出版和媒体行业拥有超过30年的经验,专注于知识产权、合同谈判、许可和全球版权管理。他于2002年加入康泰纳仕,负责开发用于版权许可和贡献者协议的可扩展系统,以促进内容在国际版本间的共享。目前,他领导着一个从亚洲到美洲的全球团队,专注于内容许可、全球联合出版、版权管理和由AI驱动的合同工作流,以适应康泰纳仕向21世纪媒体公司的演变。业余时间,Christopher 喜欢打卡遗愿清单上的旅行目的地、打网球、阅读,并与他的丈夫 Richard 以及他们的小型雪纳瑞犬 Zelda 共度时光,Zelda 明确表示是它在管理这个家。

Sarat Tatavarthi 担任康泰纳仕工程总监,领导高绩效团队设计和交付分布式网络和移动应用程序。在专业工作之外,Sarat 热衷于旅行,喜欢与家人一起探索新的国家和文化。

Alok Singh 是AWS的高级机器学习工程师,在人工智能和机器学习领域拥有超过11年的经验。他专注于帮助AWS客户设计和部署AI/ML工作负载和解决方案。在过去的3年中,他一直致力于帮助客户大规模部署生成式AI解决方案。他拥有数据科学理学硕士学位和电子与电信理学学士学位。

Andrei Ivanovic 是AWS专业服务的数据科学家,在生成式AI、计算机视觉、ML、时间序列预测和地理空间数据科学领域的内部和外部解决方案交付方面拥有经验。Andrei拥有多伦多大学的计算机科学硕士学位,曾在深度学习、机器人和自动驾驶的交叉领域进行研究。工作之余,他喜欢文学、电影、力量训练,以及与亲人共度时光。

Enjeh Anyangwe 是AWS专业服务的技术推广经理,负责领导战略客户转型和制定企业交付框架。她专注于管理复杂的AWS项目、指导跨职能团队,并在受监管行业中建立技术交付战略。她的工作涵盖了AI/ML实施、迁移、数据现代化以及财富500强公司的并购技术集成中的项目管理领导工作。她与AWS现场销售、售前和支持团队合作,推动客户采用AWS服务。Enjeh拥有康涅狄格大学商学院的MBA学位,主修运营与IT管理。工作之余,Enjeh喜欢旅行、探索新文化,以及与亲人共度美好时光。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区