📢 转载信息
原文作者:Hossein Salami, Jwalant (JD) Vyas, and Duverney Tavares
本文由 MSD 的 Hossein Salami 和 Jwalant Vyas 共同撰写。
在生物制药行业,对制造过程中的偏差(deviations)处理非常严格。每一个偏差都必须经过详尽的记录,并对其各个方面和潜在影响进行仔细审查,以确保药品质量、患者安全和合规性。对于领先的制药公司而言,稳健而高效地管理这些偏差对于维持高标准和最大程度地减少中断至关重要。
最近,默克公司(MSD,位于新泽西州拉威的默克公司)的数字制造数据科学团队认识到,可以利用新兴技术,包括向量数据库和生成式AI,来简化其偏差管理流程的某些方面。该方案由AWS服务(如Amazon Bedrock和Amazon OpenSearch)提供支持。这种创新方法旨在利用组织过去的偏差数据作为一个庞大、多样化且可靠的知识来源。通过利用制造网络中类似案例的学习经验来研究和解决每个新偏差,可以潜在地减少所需的时间和资源,并提高效率,同时保持良好生产规范 (GMP)要求所要求的严格标准。
行业趋势:AI在制药制造中的应用
制药行业越来越多地转向先进技术来增强其运营的各个方面,从早期药物发现到制造和质量控制。特别是生成式AI在简化复杂流程中的应用是一个日益增长的趋势。许多公司正在探索如何将这些技术应用于传统上需要大量专业知识和时间投入的领域,包括上述的偏差管理。这种向AI辅助流程的转变,不仅是为了提高效率,也是为了在关键领域提高结果的质量和一致性。
创新解决方案:用于偏差管理的生成式AI
为了应对偏差管理中的一些主要挑战,MSD的数字制造数据科学团队设计了一种使用生成式AI的创新解决方案(参见语言模型如何协助制药制造偏差和调查?)。该方法首先从过去的偏差报告中创建一个全面的知识库,可以对其进行智能查询,以提供各种见解,包括帮助解决新案例的重要信息。除了常规的元数据外,知识库还包含重要的非结构化数据,例如观察结果、分析过程和结论,这些通常以自然语言文本形式记录。
该解决方案旨在促进制造现场不同用户(具有不同角色和身份)与此知识源的交互。例如,用户可以快速准确地识别和访问有关过去类似事件的信息,并利用这些信息对当前案例的潜在根本原因进行假设并定义解决方案。这通过Amazon OpenSearch Service实现的混合和领域特定搜索机制得到促进。随后,信息由大型语言模型 (LLM) 处理,并根据用户的角色和需求呈现给用户。此功能不仅节省了时间,还利用了先前偏差中丰富的经验和知识。
解决方案概述:目标、风险与机遇
传统上,偏差调查是一个耗时的人工过程,需要大量的人力投入和专业知识。调查团队通常花费大量时间收集、分析和记录信息,筛选历史记录并得出结论——这种工作流程不仅劳动密集型,而且容易出现潜在的人为错误和不一致性。该解决方案旨在实现几个关键目标:
- 显著减少调查和关闭偏差所需的时间和精力
- 根据用户角色,为用户提供高准确性和灵活性的方式,轻松访问相关知识、历史信息和数据
- 确保用于得出结论的信息是可追溯和可验证的
团队也注意到了潜在的风险,例如过度依赖AI生成的建议或过时信息影响当前调查的可能性。为减轻这些风险,该解决方案主要将生成式AI的内容创建限制在低风险领域,并纳入人工监督和其他防护栏。自动化的数据管道有助于知识库及时更新最新的信息和数据。为保护专有和敏感的制造信息,该解决方案对不同组件实施了数据加密和访问控制。
此外,团队看到了在架构中纳入新元素的机会,特别是能够处理特定用户角色常见请求的智能体(agents),例如为现场经理提供高级统计数据和可视化。
技术架构:基于AWS服务的RAG方法
该解决方案架构采用检索增强生成 (RAG) 方法,以提高偏差调查的效率、相关性和可追溯性。这种架构集成了多个AWS托管服务,以构建一个可扩展、安全且具备领域感知的AI驱动系统。
该解决方案的核心是一个混合检索模块(利用Amazon OpenSearch Service的混合搜索功能),它结合了语义(基于向量)和关键词(词法)搜索,以实现高精度的信息检索。该模块建立在Amazon OpenSearch Service之上,该服务充当向量存储。OpenSearch 索引了从过去偏差报告和相关文档生成的嵌入(embeddings),并使用领域特定的元数据(如偏差类型、解决日期、受影响的产品线和根本原因分类)进行丰富。这既支持深度语义搜索,也支持基于结构化字段的高效过滤。
为了支持结构化数据存储和管理,系统使用了Amazon 关系数据库服务 (Amazon RDS)。RDS 存储了与每个偏差案例相关的规范化的表格信息,例如调查时间线、负责人员和其他操作元数据。使用 RDS,可以跨结构化维度进行复杂查询,并支持报告、合规性审计和趋势分析。
一个RAG 管道协调了检索模块与托管在Amazon Bedrock中的大型语言模型 (LLM) 之间的流程。当用户发出查询时,系统首先从 OpenSearch 检索相关文档,从 RDS 检索结构化案例数据。然后将这些结果作为上下文传递给 LLM,LLM 生成基于事实、情境化的输出,例如:
- 调查历史摘要
- 根本原因模式
- 可比较的过去事件
- 建议的后续步骤或知识差距
解决方案的高层架构图。特定于领域的偏差数据位于 Amazon RDS 和 OpenSearch 上。文本向量嵌入及相关元数据位于 OpenSearch 上,以支持各种搜索功能。
结论与后续步骤
本文探讨了MSD如何利用生成式AI和数据库的力量来优化和转变其制造偏差管理流程。通过创建过去事件、偏差和发现的准确、多方面知识库,该公司旨在显著减少每个新案例所需的时间和精力,同时保持最高的质量和合规性标准。
作为下一步,该公司计划对制药质量领域的用例进行全面审查,并通过集成结构化和非结构化来源(使用此创新中的方法)来构建一个企业级的生成式AI产品。该创新带来的一些关键能力包括数据架构、数据建模(包括元数据策展)以及生成式AI相关组件。展望未来,我们计划使用Amazon Bedrock Knowledge Bases的功能,它将在保持与AWS环境无缝集成的同时,提供更先进的语义搜索和检索功能。如果成功,这种方法不仅可能为MSD的偏差管理设定新标准,还可能为更高效、集成和知识驱动的制造质量流程(包括投诉、审计等)铺平道路。
关于作者
Hossein Salami 是 MSD 数字制造组织的资深数据科学家。他拥有化学工程博士学位,具备超过9年的实验室和工艺研发经验背景,他参与利用先进技术构建数据科学和AI/ML解决方案,以解决核心业务问题和应用。
Jwalant (JD) Vyas 是 MSD 调查数字产品组合的数字产品线负责人,在质量运营、QMS、工厂运营、制造、供应链和药物产品开发方面拥有 25 年以上的生物制药经验。他领导质量运营的数字化转型,以提高效率、加强合规性并增强决策能力。凭借深厚的业务领域和技术专长,他将技术深度与战略领导力相结合。
Duverney Tavares 是亚马逊云科技 (AWS) 的资深解决方案架构师,专注于指导生命科学公司完成其数字化转型之旅。凭借在数据仓库、大数据与分析以及数据库管理方面二十多年的经验,他运用自己的专业知识帮助组织利用数据驱动业务增长和创新。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区