目 录CONTENT

文章目录

Myriad Genetics如何利用AWS开源生成式AI智能文档处理加速器实现快速、准确且经济高效的文档处理

Administrator
2025-12-10 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/how-myriad-genetics-achieved-fast-accurate-and-cost-efficient-document-processing-using-the-aws-open-source-generative-ai-intelligent-document-processing-accelerator/

原文作者:Priyashree Roy, Mofijul Islam, Martyna Shallenberg, Brode Mccrady, Nivedha Balakrishnan, and Randheer Gehlot


本文由 Myriad Genetics 的 Martyna Shallenberg 和 Brode Mccrady 撰写。

医疗保健组织在处理和管理大量复杂的医疗文档时,面临着在保持患者护理质量的同时应对挑战。这些组织需要有效的文档处理解决方案来满足日益增长的需求。全球领先的基因检测和精准医疗解决方案提供商 Myriad Genetics 正在应对这一挑战。

Myriad 的收入工程部门每天处理数千份跨越女性健康、肿瘤学和心理健康部门的医疗文件。公司将收到的文档分类为测试请求表、实验室结果、临床注释和保险等类别,以实现预授权工作流程的自动化。系统根据识别出的文档类别将这些文档路由给适当的外部供应商进行处理。他们手动执行关键信息提取(KIE),包括保险详细信息、患者信息和测试结果,以确定联邦医疗保险资格并支持下游流程。

随着文档量的增加,Myriad 现有的系统面临挑战。虽然自动文档分类解决方案有效,但成本高昂且耗时。信息提取仍然是手动的,因为它需要理解上下文,以区分关键的临床区别(例如“是转移性的”与“不是转移性的”)并从不同格式的文档中定位保险号码和患者信息等信息。处理负担是巨大的,仅在女性健康部门,客户服务就需要多达 10 名全职员工每天贡献 78 小时。

Myriad 需要一个解决方案来:

  • 在保持或提高准确性的同时降低文档分类成本
  • 加速文档处理以消除工作流程瓶颈
  • 实现医疗文档信息的自动化提取
  • 跨多个业务部门和文档类型进行扩展

Amazon Bedrock 和生成式 AI

现代大型语言模型(LLM)由于在海量文本语料库上进行了预训练,能够以高准确率处理复杂的医疗文档。这种预训练使 LLM 能够理解语言模式和文档结构,而无需进行特征工程或大规模标注数据集。Amazon Bedrock 是一项全托管服务,提供来自领先 AI 公司的广泛高性能 LLM。它为处理敏感医疗信息所需的医疗保健组织提供了安全、隐私和负责任的 AI 功能。对于此解决方案,我们使用了 AWS 最新的基础模型:

  • Amazon Nova Pro:一种经济高效、低延迟的模型,非常适合文档分类
  • Amazon Nova Premier:一种具有推理能力的先进模型,用于信息提取

解决方案概述

我们使用 AWS 的开源 GenAI IDP 加速器与 Myriad 合作实施了解决方案。该加速器提供了一个可扩展的无服务器架构,可将非结构化文档转换为结构化数据。该加速器通过可配置的并发限制并行处理多个文档,而不会使下游服务超载。其内置的评估框架允许用户通过用户界面(UI)提供预期输出,并评估生成的​​结果,以迭代地定制配置并提高准确性。

该加速器提供 1-click 部署,并提供根据不同工作负载、可配置性、成本和准确性要求优化的一组预构建模式:

  • 模式 1 – 使用 Amazon Bedrock 数据自动化,一项全托管服务,提供丰富的开箱即用功能、易用性和直接的按页定价。此模式推荐用于大多数用例。
  • 模式 2 – 使用 Amazon Textract 和 Amazon Bedrock 配合 Amazon Nova、Anthropic 的 Claude 或自定义微调的 Amazon Nova 模型。此模式非常适合需要自定义逻辑的复杂文档。
  • 模式 3 – 使用 Amazon Textract、Amazon SageMaker 配合用于分类的微调模型,以及 Amazon Bedrock 用于提取。此模式非常适合需要专业分类的文档。

模式 2 被证明最适合此项目,它满足了低成本这一关键要求,同时通过提示工程和 LLM 选择提供了优化准确性的灵活性。此模式提供无代码配置——通过配置(可在 Web UI 中编辑)来自定义文档类型、提取字段和处理逻辑。

我们通过模式 2 的配置文件定制了文档类别、关键属性及其每类文档的定义、LLM 选择、LLM 超参数以及分类和提取 LLM 提示。在生产环境中,Myriad 将此解决方案集成到其现有的事件驱动架构中。下图说明了生产管道:

  1. 文档摄取:传入的订单事件触发文档从源文档管理系统检索,并对先前处理的文档进行缓存优化。
  2. 并发管理DynamoDB 跟踪并发的 AWS Step Function 作业,而 Amazon 简单队列服务 (SQS) 队列化超出并发限制的文件以进行文档处理。
  3. 文本提取:Amazon Textract 从标准化文档中提取文本、布局信息、表格和表单。
  4. 分类:配置的 LLM 根据配置文件中提供的自定义文档分类提示分析提取的内容,并将文档分类到适当的类别中。
  5. 关键信息提取:配置的 LLM 使用配置文件中提供的提取提示提取医疗信息。
  6. 结构化输出:管道以结构化的方式格式化结果,并通过 RESTful 操作传递给 Myriad 的授权系统。

使用生成式 AI 进行文档分类

尽管 Myriad 现有的解决方案实现了 94% 的准确率,但由于文档类型之间存在结构相似性、内容重叠和格式模式共享,仍然会发生错误分类。这种语义模糊性使得区分相似文档变得困难。我们指导 Myriad 采用提示优化技术,利用 LLM 的上下文理解能力。这种方法超越了模式匹配,实现了对文档上下文和目的的语义分析,识别出人类专家识别但以前的自动化系统错过的区分特征。

用于文档分类的 AI 驱动的提示工程

我们根据相似文档类型之间的区分特征定义了类别。为了识别这些差异点,我们将每个类别的文档样本提供给 Amazon Bedrock 上的 Anthropic Claude Sonnet 3.7,并启用了模型推理(一项允许模型展示其分步分析过程的功能)。该模型识别了相似文档类别之间的区分特征,Myriad 的主题专家对此进行了完善,并将其纳入 GenAI IDP 加速器的模式 2 配置文件中用于文档分类提示。

基于格式的分类策略

我们使用文档结构和格式作为关键的区分因素,以区分内容相似但结构不同的文档类型。我们使分类模型能够识别特定于格式的特征,例如布局结构、字段排列和视觉元素,从而使系统能够区分仅凭文本内容无法区分的文档。例如,实验室报告和测试结果都包含患者信息和医疗数据,但实验室报告以表格格式显示数值,而测试结果则采用叙述格式。我们指示 LLM:“实验室报告包含按表格组织的数值结果以及参考范围和单位。测试结果以段落形式呈现发现,并附有临床解释。

实施负面提示以提高准确性

我们实施了负面提示技术,通过明确指示模型应避免哪些分类来解决相似文档之间的混淆。此方法向分类提示中添加了排除性语言,指定不应与每种文档类型相关联的特征。最初,由于患者病史和实验室测量结果之间的混淆,系统经常将测试请求表(TRF)错误地分类为测试结果。向 TRF 定义添加负面提示,例如“这些表格包含患者病史。请勿将其与包含当前/近期实验室测量的测试结果混淆”,使分类准确率提高了 4%。通过提供有关常见错误分类模式的明确指导,系统避免了相似文档类型之间典型的错误和混淆。

面向成本和性能优化的模型选择

模型选择决定了规模化下的最佳成本性能,因此我们使用 GenAI IDP 加速器的评估框架对四种基础模型——Amazon Nova Lite、Amazon Nova Pro、Amazon Nova Premier 和 Anthropic Claude Sonnet 3.7——进行了全面基准测试,测试了 1,200 份跨越测试请求表、实验室结果和保险三个文档类别的医疗文档。我们使用三个关键指标评估每个模型:分类准确率、处理延迟和每文档成本。加速器的成本跟踪实现了不同模型配置之间运营费用的直接比较,确保了性能提升能够转化为规模化下的可衡量业务价值。

评估结果表明,Amazon Nova Pro 为 Myriad 的用例实现了最佳平衡。我们将 Myriad 的 Amazon Comprehend 实现迁移到具有优化提示的 Amazon Nova Pro 进行文档分类,实现了显著改进:分类准确率从 94% 提高到 98%,处理成本降低了 77%,处理速度提高了 80%——将每个文档的分类时间从 8.5 分钟减少到 1.5 分钟。

使用生成式 AI 自动化关键信息提取

Myriad 的信息提取是手动的,仅在女性健康部门就需要多达 10 名全职员工每天贡献 78 小时,这造成了运营瓶颈和可扩展性限制。自动化医疗 KIE 面临挑战:复选框字段需要区分标记样式(勾号、X 或手写标记);文档包含重叠标记或跨越多个字段的内容等模糊视觉元素;提取需要上下文理解才能区分临床差异并在不同文档格式中定位信息。我们与 Myriad 合作开发了自动 KIE 解决方案,实施了以下优化技术来解决提取复杂性。

增强的 OCR 配置以识别复选框

为解决复选框识别挑战,我们在 GenAI IDP 加速器门户上启用了 Amazon Textract 的专用 TABLES 和 FORMS 功能,如下图所示,以提高 OCR 对选中和未选中复选框元素的区分能力。这些功能增强了系统检测和解释医疗表格中标记样式的能力。

我们通过将视觉线索纳入提取提示来提高准确性。我们使用“查找方框(✓、x 或手写标记)内或周围的可见标记”等说明更新了提示,以指导语言模型识别复选框选择。这种增强的 OCR 功能与目标提示的结合,提高了医疗表格中复选框提取的准确性。

通过少样本示例进行视觉上下文学习

仅配置 Textract 和改进提示无法有效处理复杂的视觉元素。我们实施了一种多模态方法,将文档图像和 Textract 提取的文本同时发送给基础模型,从而能够同时分析视觉布局和文本内容以做出准确的提取决策。我们通过提供示例文档图像及其预期的提取输出来实现少样本学习,以指导模型理解各种表单布局和标记样式。多个带有正确提取模式的文档图像示例会产生冗长的 LLM 提示。我们利用 GenAI IDP 加速器内置的与 Amazon Bedrock 提示缓存功能集成来降低成本和延迟。提示缓存将冗长的少样本示例在内存中保留 5 分钟——当在此时间段内处理多个相似文档时,Bedrock 会重用缓存的示例而不是重新处理它们,从而降低了成本和处理时间。

用于复杂提取的思维链推理

虽然这种多模态方法提高了提取准确性,但我们在复杂的表单布局中仍然面临重叠和模糊的勾选标记的挑战。为了在模糊和复杂的情况下表现出色,我们使用了 Amazon Nova Premier,并实施了思维链(Chain of Thought)推理,让模型使用思考标签逐步推导提取决策。例如:

分析此表单中的复选框标记:<thinking>
1. 存在哪些复选框?[列出所有可见的选项]
2. 标记位于何处?[描述标记位置]
3. 哪些标记清晰,哪些模糊?[评估标记质量]
4. 对于重叠的标记:哪个复选框包含大部分标记?
5. 标记是位于中心还是接触边缘?[优先考虑中心位置]
</thinking>

此外,我们在少样本示例中加入了推理解释,演示了我们如何在模糊案例中得出结论。这种方法使模型能够在做出最终决定之前,通过复杂的视觉证据和上下文线索进行推导,从而提高了对模糊勾选标记的处理性能。

通过 GenAI IDP 加速器对 32 个不同复杂程度的文档样本进行测试后发现,启用了 Layout、TABLES 和 FORMS 功能的 Amazon Textract,结合 Amazon Nova Premier 的高级推理能力以及少样本示例的纳入,提供了最佳结果。该解决方案实现了 90% 的准确率(与人工评估基线准确率相同),同时每个文档的处理时间约为 1.3 分钟。

结果和业务影响

通过我们的新解决方案,我们实现了满足项目初期既定业务目标的显著改进:

文档分类性能:

  • 通过使用 Amazon Nova Pro 进行提示优化技术,包括 AI 驱动的提示工程、基于文档格式的分类策略和负面提示,我们将准确率从 94% 提高到 98%
  • 通过从 Amazon Comprehend 迁移到使用优化提示的 Amazon Nova Pro,我们将分类成本降低了 77%(从每页 3.1 美分降至 0.7 美分)
  • 通过选择 Amazon Nova Pro 提供低延迟和经济高效的解决方案,我们将分类时间减少了 80%(从每个文档 8.5 分钟减少到 1.5 分钟)

新的自动化关键信息提取性能:

  • 通过结合 Amazon Textract 的文档分析能力、通过少样本示例进行的视觉上下文学习以及 Amazon Nova Premier 对复杂数据解释的推理,我们实现了 90% 的提取准确率(与基线手动流程相同)
  • 与手动基线(每个业务部门需要多达 10 名全职员工每天工作 78 小时)相比,我们将处理成本降至每页 9 美分,每个文档的处理时间为 1.3 分钟

业务影响和推广

Myriad 已计划分阶段推出,首先从文档分类开始。他们计划首先在女性健康业务部门推出新的分类解决方案,随后是肿瘤学和心理健康部门。由于我们的工作,Myriad 在文档分类成本上每年可节省高达 13.2 万美元。该解决方案将每次预授权提交时间减少了 2 分钟——由于可以更快地访问标记的文档,专家现在只需四分钟而不是六分钟即可完成订单。仅在女性健康部门,这项改进每月即可节省 300 小时(涉及 9,000 次预授权),相当于每位预授权专家的 50 小时。

这些可衡量的改进改变了 Myriad 的运营方式,正如其工程领导层确认的那样:

“与 GenAIIC 合作,将我们的智能文档处理解决方案从 AWS Comprehend 迁移到 Bedrock 是一次变革性的飞跃。通过提高性能和准确性,该解决方案预计每月可节省超过 10,000 美元。该团队与 Myriad 内部工程团队的紧密合作交付了一个高质量、可扩展的解决方案,而他们对先进语言模型的深入专业知识提升了我们的能力。这是创新与合作如何推动可衡量业务影响的绝佳范例。”
– Martyna Shallenberg,Myriad Genetics 软件工程高级总监

结论

AWS GenAI IDP 加速器实现了 Myriad 的快速实施,提供了一个灵活的框架,缩短了开发时间。医疗保健组织需要定制的解决方案——该加速器提供了广泛的定制功能,使用户无需进行广泛的代码更改或在开发过程中频繁重新部署即可根据特定文档类型和工作流程调整解决方案。我们的方法证明了战略性提示工程和模型选择的力量。我们通过专注于提示设计(包括负面提示和视觉线索),在一个专业领域实现了高准确性。我们通过为分类选择 Amazon Nova Pro,为复杂提取选择 Nova Premier,从而优化了成本和性能——为每项特定任务匹配正确的模型。

亲自探索解决方案

希望改进文档处理工作流程的组织可以亲身体验这些好处。为 Myriad 转型提供支持的开源 GenAI IDP 加速器可供您在自己的环境中部署和测试。加速器简单的设置过程使用户能够快速评估生成式 AI 如何改变文档处理挑战。

在您探索了加速器并看到了它对工作流程的潜在影响后,请联系 AWS GenAIIC 团队,探讨如何为您的特定用例定制和优化 GenAI IDP 加速器。这种实践方法确保您可以就如何在组织中实施智能文档处理做出明智的决定。


作者简介

Priyashree Roy 是 AWS 生成式 AI 创新中心的数据科学家 II,她在那里运用她在机器学习和生成式 AI 方面的专业知识,为战略性 AWS 客户开发创新解决方案。她以佛罗里达州立大学实验粒子物理学博士学位和密歇根大学博士后研究为基础,对复杂的业务挑战采取严谨的科学方法。

Mofijul Islam 是 AWS 生成式 AI 创新中心的 II 级应用科学家和技术负责人,他帮助客户利用生成式 AI、大型语言模型(LLM)、多智能体学习、代码生成和多模态学习来应对以客户为中心的研究和业务挑战。他拥有弗吉尼亚大学机器学习博士学位,其研究重点是多模态机器学习、多语言自然语言处理(NLP)和多任务学习。他的研究发表在 NeurIPS、国际学习表征会议 (ICLR)、自然语言处理经验方法 (EMNLP)、人工智能与统计学会 (AISTATS) 以及电气电子工程师学会 (IEEE) 和计算机械协会 (ACM) 会刊等顶级会议上。

Nivedha Balakrishnan 是 ... [内容被截断]




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区