📢 转载信息
原文作者:Alex Boudreau, Cuong Lai and Praveen Haranahalli
临床结果评估(COA)访谈是临床试验中评估治疗效果和安全性的重要工具。在精神病学、焦虑症和情绪障碍的研究中,这些评估往往决定了试验的成败,凸显了数据质量和可靠性的重要性。传统上,评估这些结果的质量非常复杂,涉及耗时且后勤上具有挑战性的、近乎实时地审查音视频录音。访谈评估的变异性、评估技术不佳以及其他因素可能引入噪声,导致结果不可靠,甚至可能导致研究失败。
关于 Clario
Clario 是端点数据解决方案的领先供应商,专注于系统地收集、管理和分析特定的、预定义的临床试验结果(端点),以评估治疗的安全性和有效性。Clario 为寻求为患者带来新疗法的生命科学公司生成高质量的临床证据。自 50 多年前成立以来,Clario 已部署了超过 30,000 次端点数据解决方案,支持了 100 多个国家/地区的 710 多项新药监管批准。
在本文中,我们将演示 Clario 如何利用 Amazon Bedrock 和其他 AWS 服务构建一个由 AI 驱动的解决方案,以自动化和改进 COA 访谈的分析。我们将讨论 Clario 如何:
- 实施说话人区分(speaker diarization)、多语言转录和大型语言模型(LLM)
- 使用向量数据库和语义搜索来评估访谈质量
- 在保持监管合规性的同时,将自动化整合到复杂的评估审查流程中
业务挑战
Clario 寻求彻底改变其 COA 审查方法,以提高运营效率并提升数据质量。该公司需要一个系统,能够在全球范围内应对多语言数据的标准化审查这一关键挑战,同时减少不同专家审阅者之间存在的自然差异,并在复杂的 COA 访谈过程中保持一致的评估质量。该解决方案还需要高效地管理大量的音频录音,同时满足严格的监管和隐私要求。Clario 寻求的能力可以自动分析 COA 访谈期间的语音和对话,以潜在地实现以下目标:
- 减少主观性和变异性——提供更一致、更可靠的行为健康评估,最大限度地减少研究站点和评分者的偏见。
- 增强数据质量和可信度——通过客观、标准化和可重复的访谈评估,提高试验结果的稳健性。
- 精简运营——自动化的复杂评估审查和评分可以为地理位置分散的站点和赞助方级别的临床团队节省时间和资源。
- 加速决策制定——更早获得清晰的见解可以支持试验赞助商更快地做出基于证据的“继续”或“停止”决策。
解决方案
为了应对这一挑战,Clario 选择 AWS,因为它提供全面的人工智能和机器学习(AI/ML)能力,并且有能力在全球范围内部署 符合 HIPAA 标准的服务。Clario 利用生成式 AI 和 Amazon Bedrock(一项完全托管的服务,提供对各种高性能基础模型的访问)的强大功能,提供了几个关键优势:
- 无需基础设施管理 – 减轻管理 AI 模型基础设施和更新的操作负担
- 多模型访问 – 在领先的基础模型中进行比较和选择,以优化其特定 COA 分析需求的性能
- 内置合规性功能 – 对数据治理、审计跟踪和对临床研究至关重要的监管要求的原生支持
- 快速原型设计和部署 – 通过无服务器架构和预构建的集成加速上市时间
- 无缝的 AWS 系统集成 – 与现有 AWS 服务在数据存储、处理和分析方面的原生兼容性
- 企业级安全和隐私控制 – 先进的加密、访问控制和数据驻留选项,以帮助满足严格的行业标准
- 持续的模型改进 – 自动获取模型更新和新功能,减少迁移复杂性
这种全面的方法使 Clario 能够专注于其核心能力——临床研究卓越性——同时通过受信任、合规的系统利用尖端的 AI 功能。
该解决方案集成了先进的 AI 功能,包括说话人区分、多语言转录、语义搜索和智能体(agentic)AI,以一种类似于专家人工集中审阅者的方式,自动审查复杂 COA 访谈的质量。该工作流程协调了多个步骤,首先根据说话人的声音分析音频数据以识别唯一的说话人,然后进行语音转文本转换,并将说话人角色归属,以确定哪些语音对应于面试官和研究参与者。
这些信息根据说话人轮次和自然对话边界被分割成具有语义意义的块,每个块都保留了关键的元数据。元数据的示例包括时间戳、说话人角色和位置上下文。然后,这些块被向量化并存储在 Amazon OpenSearch 向量数据库中,从而使系统能够在处理冗长的访谈时克服基础模型的上下文窗口限制。该解决方案实现了一种复杂的检索策略,其中:
- 重叠窗口确保在片段边界处不会丢失上下文信息
- 有针对性的语义搜索识别与每个评估标准相关的特定对话片段
- 分层方法通过访谈级别摘要和说话人角色来维护本地对话流程和全局访谈上下文
- 当评估跨越多个片段的标准时,可以动态组装滚动上下文窗口
这种架构允许系统对同一访谈数据高效地执行多个查询,同时在整个对话中保持上下文关系。该系统利用这种语义检索能力来分析面试官和参与者之间对话的内容,并根据结构化的访谈指南和集中审查清单对其进行评估。工作流程的输出包括访谈的质量评分,以及针对每个清单项目的结构化反馈,指明访谈偏离既定标准的位置。整个系统提供了关于 COA 访谈质量和可靠性的近乎实时洞察,支持试验赞助商更快地做出基于证据的“继续”或“停止”决策。
解决方案架构
以下架构图说明了解决方案的实施情况:

工作流程包括以下步骤:
- 访谈的 COA 录音(音频和视频文件)通过专用的录音应用程序在本地(1)收集。文件使用 AWS Direct Connect 通过加密传输上传到 Amazon Simple Storage Service (Amazon S3)(2)。上传的文件随后使用服务器端对象级别加密自动存储。
- 文件上传后,Clario 的 AI 编排引擎(3)利用 Amazon SageMaker 上的自定义说话人区分模型(4)提取音频并识别唯一说话人的语音片段。
- 编排引擎还调用 Amazon Bedrock API 进行自动音频转录。Clario 使用 Amazon Bedrock Marketplace(5)中的 Whisper 模型来生成 COA 访谈录音的近乎实时的转录。然后,转录文本会用说话人信息和时间码进行注释,并使用嵌入模型(Amazon Titan Text Embeddings v2 模型)进行向量化,并存储到 Amazon OpenSearch(7)中以供语义检索。
- 信息被向量化并存储后,Clario 的 AI 编排引擎在 Amazon Elastic Kubernetes Service (Amazon EKS)(3)上运行一个基于图的智能体系统,以实现自动化的 COA 访谈审查。该智能体实现了一个多步骤工作流程,该工作流程:(1) 从配置中检索评估的结构化访谈指南,(2) 加载相应的集中审查清单标准,以及 (3) 系统地查询 Amazon OpenSearch(7)以提取相关的访谈片段。利用任务的预配置图结构,该智能体遍历预定义的决策节点,将访谈回答与标准化评估标准进行比较,识别差距或不一致之处,并生成带有支持证据引用的结构化发现。
- 该智能体使用 Amazon Bedrock(6)中的 Anthropic Claude 3.7 Sonnet 等先进的大型语言模型(LLM)来对语音片段进行分类,判断是面试官还是参与者,并确定每次访谈轮次是否满足访谈质量标准。
- Clario 的 AI 编排引擎随后编译访谈的总体审查结果,并将信息持久化到 Amazon Relational Database Service (Amazon RDS)(8)中。
- AI 驱动的自动化审查结果可以通过客户端应用程序(9)通过调用 Amazon API Gateway 端点(10)上的 Rest API 来检索。
益处与成果
这个由 AI 驱动的解决方案的初步实施在改进 Clario 的临床试验流程方面显示出希望:
- 运营效率
- 有望将人工审查工作量减少 90% 以上。
- 质量改进
- 与仅人工抽查较小比例录音相比,通过自动化审查可实现高达 100% 的数据覆盖率。
- 可以快速周转,实现高度集中的干预措施,只关注需要补救的评分者和站点。
- 业务影响
- 通过将集中审查时间从数周缩短到数小时,有可能缩短周转时间。
- 提高监管提交数据的可靠性。
- 降低研究失败和结果无法解释的风险。
- 提高临床试验运营的可扩展性。
经验教训和最佳实践
在开发和部署此解决方案的过程中,Clario 获得了宝贵的见解和经验教训,这些可以使其他寻求实施类似 AI 驱动系统的组织受益:
- 负责任的 AI 开发和使用的重要性——在初步测试中,Clario 发现 LLM 有时会生成听起来合理但事实不准确的摘要。这一关键发现强化了在医疗保健应用中负责任的 AI 实践的重要性。这促使 Clario 实施了一个验证系统,在该系统中,AI 输出在人工审查之前会与源文档进行交叉检查,以确保事实准确性。
- 持续的模型评估——Clario 采用严格的模型评估流程,以在其 AI 驱动的 COA 访谈分析解决方案中保持最高标准的质量和可靠性。Clario 通过多种方法定期评估其 AI 模型的性能和准确性,包括在自定义数据集上对多个模型和配置进行比较研究。
- 可扩展且更安全的架构——该解决方案的无服务器、云原生架构——使用了 Amazon Bedrock、Amazon S3 和 AWS Lambda 等服务——帮助 Clario 有效地扩展其解决方案,同时优先考虑数据安全和合规性。
后续步骤与结论
Clario 的创新解决方案有潜力改变 COA 的审查和评级方式,显著提高临床试验数据的可靠性,并减少人工审查所需的时间和精力。随着 Clario 继续完善和扩展此 AI 驱动系统的功能,它正在探索神经科学研究中依赖临床访谈来评估治疗安全性和有效性的其他用例。
通过利用生成式 AI 和 Amazon Bedrock 的强大功能,Clario 为临床试验数据分析设定了新的标准。这使得其客户能够做出更明智的决策,并加速改变人生的疗法开发。
作者简介
Alex Boudreau 是 Clario 的 AI 总监。他领导公司创新的生成式 AI 部门,并监督公司先进的多模态 GenAI 平台的开发,该平台涵盖尖端的云工程、AI 工程和基础 AI 研究。Alex 此前曾开创汽车应用的深度学习语音分析系统、领导基于云的企业欺诈检测解决方案、推进对话式 AI 技术,并在医学图像分析领域进行了突破性项目。他在领导高影响力项目方面的专业知识,使他能够在推动商业世界中 AI 技术的边界方面处于独特的地位。
Cuong Lai 是 Clario 生成式 AI 团队的技术团队负责人,负责推动公司生成式 AI 平台的开发和扩展。他拥有八年多的软件工程经验,专注于 Web 开发、API 设计和架构云原生解决方案。Cuong 在利用 AWS 服务构建安全、可靠和高性能的系统以支持大规模 AI 工作负载方面拥有丰富的经验。他对推进生成式 AI 技术和交付创新的、可投入生产的 AI 解决方案充满热情。
Praveen Haranahalli 是亚马逊云科技(AWS)的高级解决方案架构师,负责架构安全、可扩展的云解决方案,并为各种企业客户提供战略指导。凭借近二十年的 IT 经验,Praveen 已经在多个行业中交付了变革性的实施。作为一名值得信赖的技术顾问,他与客户合作实施强大的 DevSecOps 管道、建立全面的安全护栏,并开发创新的 AI/ML 解决方案。他对通过尖端云架构解决复杂的业务挑战,以及利用人工智能和机器学习赋能组织实现成功的数字化转型充满热情。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区