📢 转载信息
原文链接:https://www.microsoft.com/en-us/research/blog/using-ai-to-assist-in-rare-disease-diagnosis/
原文作者:Microsoft Research
利用AI赋能罕见病诊断:微软研究人员探索生成式AI助理在基因专业人士工作中的应用
发布时间:2025年9月22日
作者:Mandi Hall (高级用户体验/客户体验研究员), Ashley Conard (高级研究员)

在充满希望且快速发展的基因分析领域,准确解读全基因组测序(WGS)数据对于诊断罕见遗传病和改善患者预后至关重要。然而,尽管技术不断进步,遗传学专业人员在管理和综合分析这些诊断所需的海量数据方面仍面临严峻挑战。不到 50% 的初始病例能获得明确诊断,而且尽管重新分析可能带来新发现,但该过程仍然耗时且复杂。
为了更好地理解和应对这些挑战,微软研究院与德雷塞尔大学(Drexel University)和博德研究所(Broad Institute)合作,进行了一项题为《AI 增强的意义构建:探索生成式 AI 助理的设计以支持遗传学专业人士》(AI-Enhanced Sensemaking: Exploring the Design of a Generative AI-Based Assistant to Support Genetic Professionals)的综合研究。该研究最近发表在《ACM 交互式智能系统汇刊》(ACM Transactions on Interactive Intelligent Systems)的生成式 AI 专题中。
该研究重点在于整合生成式 AI,以支持全基因组测序分析中复杂、耗时且信息密集的意义构建任务。通过详细的实证研究和与该领域专家的合作设计会议,我们确定了遗传学专业人士面临的关键障碍,并提出了由 AI 驱动的解决方案来增强他们的工作流程。我们制定了生成式 AI 如何帮助综合生物医学数据的策略,使 AI 与专家的协作能够提高以往未解决的罕见病的诊断率——最终目标是改善患者的生活质量和预期寿命。
全基因组测序在罕见病诊断中的作用
罕见病影响着全球多达五亿人,获得诊断可能需要数年时间。这些诊断通常涉及专科会诊、实验室检查、影像学研究和侵入性手术。全基因组测序通过将患者的 DNA 序列与参考基因组进行比较,用于识别导致这些疾病的遗传变异。
遗传学专业人员使用像 seqr 这样的生物信息学工具——一个用于罕见病病例分析和项目管理的开源、基于 Web 的工具——来协助他们筛选和优先处理超过 100 万个变异体,以确定它们在疾病中的潜在作用。他们工作的一个关键组成部分是“意义构建”(sensemaking):即搜索、筛选和综合数据,以从复杂的基因和变异信息集中建立、完善和呈现模型的过程。
这个多步骤的测序过程通常需要三到十二周,需要大量的证据和时间来综合和汇总信息,以了解基因和变异对患者的影响。如果患者的病例仍未解决,其全基因组测序数据将被搁置,直到有足够的时间进行重新分析。这造成了患者病例的积压。能够轻松识别何时出现新的科学证据以及何时重新分析未解决的病例,是缩短患者在未知罕见病诊断下痛苦时间的关键。
AI 系统在协助复杂人类任务中的潜力
大约 87% 的 AI 系统从未投入使用,仅仅是因为它们解决了错误的问题。理解不同类型专业人员所需的 AI 支持、他们当前的工作流程和 AI 能力,对于成功的 AI 系统部署和使用至关重要。在 AI 设计中,将技术能力与用户任务相匹配尤其具有挑战性,因为 AI 模型可以生成大量的输出,而且它们的能力可能不明确。要设计出有效的 AI 基础系统,需要确定 AI 可以支持的任务,确定适当的 AI 介入程度,并设计用户与 AI 的交互。这需要考虑人与技术如何交互,以及如何将 AI 最有效地整合到工作流程和工具中。
研究目标与基因 AI 助理的共创设计
我们的研究旨在了解进行全基因组测序分析的遗传学专业人士当前面临的挑战和需求,并探索他们希望 AI 助理在哪些任务中提供支持。研究的第一阶段是通过访谈 17 位遗传学专业人士来深入了解他们的工作流程、工具和挑战,其中包括直接参与数据解释的遗传分析师以及参与全基因组测序的其他角色。在研究的第二阶段,我们与研究参与者就 AI 助理如何支持他们工作流程召开了共创设计会议。随后,我们开发了一个 AI 助理的原型,并在后续的设计演练会议中与研究参与者一起对其进行了进一步的测试和完善。
识别全基因组测序分析中的挑战
通过对遗传学专业人士的深入访谈,我们的研究发现了全基因组测序分析中的三个关键挑战:
- 信息过载:遗传分析师需要从多个来源收集和综合大量数据。这项任务非常耗时,并且容易出现人为错误。
- 协作共享:与领域内其他人分享发现可能既麻烦又效率低下,通常依赖过时的方法,从而减慢了协作分析过程。
- 重新分析的优先级排序:鉴于新科学发现的持续涌入,优先对未解决的病例进行重新分析是一项艰巨的挑战。分析师需要一种系统性的方法来识别最有可能因重新分析而受益的病例。
遗传学专业人员强调了从不同数据源收集和综合基因和变异信息所花费的时间。其他遗传学专业人员可能对某些基因和变异有见解,但与他人分享和解释信息以进行协作性意义构建需要大量的时间和精力。尽管新科学发现可以通过重新分析影响未解决的病例,但根据新发现确定病例的优先级,考虑到未解决病例的数量和遗传学专业人员有限的时间,仍然很困难。
与专家共创设计和人机意义构建任务
我们的研究参与者优先考虑了 AI 助理的两个潜在任务。第一个任务是根据新的科学发现标记需要重新分析的病例。该助理将提醒分析师哪些未解决的病例可能受益于新的研究,并提供从最新出版物中提取的相关更新。第二个任务侧重于从科学文献中汇总和综合有关基因和变异的信息。此功能将从大量科学论文中汇编基本信息,以用户友好的格式呈现,为分析师节省大量时间和精力。
参与者强调了在他们审查的证据中需要在选择性和全面性之间取得平衡。他们还设想与其他遗传学专业人士合作,解释、编辑和验证由 AI 助理生成的工件。遗传学专业人士需要在其工作流程的不同阶段都需要广泛和集中的证据。AI 助理的原型被设计为允许灵活的筛选和彻底的证据汇总,确保用户可以深入研究全面的数据或有选择地关注相关细节。原型包括协作意义构建功能,使用户能够集体解释、编辑和验证 AI 生成的信息。这种方法不仅强调了 AI 输出的可信度,还促进了遗传学专业人士之间的共同理解和决策。
专家-AI 意义构建的设计启示
在基因序列分析不断变化的前沿领域,利用生成式 AI 增强意义构建提供了引人入胜的可能性。保持知识更新、综合来自不同来源的信息并做出明智决策是一项具有挑战性的任务。
我们的研究参与者强调了在不丢失关键组成部分的情况下整合来自多个来源的数据、记录决策理由以及培养协作环境方面的障碍。生成式 AI 模型凭借其先进的能力,已经开始通过自动生成交互式工件来支持意义构建来应对这些挑战。然而,此类系统的有效性取决于仔细的设计考虑,尤其是在它们如何促进分布式意义构建、支持初始和持续的意义构建,以及如何组合来自多种模式的证据方面。接下来,我们将讨论使用生成式 AI 模型支持意义构建的三个设计考量因素。
分布式专家-AI 意义构建设计
生成式 AI 模型可以创建有助于个人用户意义构建过程的工件;然而,真正的潜力在于在用户之间共享这些工件,以促进集体理解和效率。我们研究中的参与者强调了在与 AI 生成内容交互时,可解释性、反馈和信任的重要性。信任是通过查看被其他用户标记为正确的工件部分,或观察对 AI 生成信息的编辑而获得的。然而,一些用户警告不要过度依赖 AI,因为这可能会掩盖潜在的不准确性。因此,设计策略应确保任何更正都清晰地标记和注释。此外,为了增强分布式意义构建,其他人的笔记的可视化以及通过 AI 进行的特定于上下文的综合可以简化该过程。
初始专家-AI 意义构建和再意义构建设计
在我们快节奏、信息驱动的世界中,了解情况的初始状态以及新信息出现时的情况至关重要。意义构建本质上是时间性的,反映并塑造了我们对时间的理解,因为我们会重新访问任务以重新评估过去的决定或纳入新信息。生成式 AI 在此发挥着关键作用,它将静态数据转化为动态演变的工件,提供了过去推理的全面视图。此类 AI 生成的工件提供了连续性,允许用户——无论是最初的决策者还是新加入的个人——访问早期任务实例中所做决定的基本原理。通过不断编辑和更新这些工件,生成式 AI 突出了自上次审查以来出现的新信息,支持持续的理解和决策制定。此外,AI 系统通过总结先前的笔记和问题来增强透明度,从而深入了解结论是如何得出的。这种反思能力不仅可以加强初始的意义构建工作,还可以让用户具备在出现新数据时进行知情再意义构建所需的清晰度。
结合多模态证据以增强 AI-专家意义构建
结合多模态证据的能力对于有效的意义构建至关重要。用户通常需要将不同类型的数据——文本、图像、空间坐标等——整合到一个连贯的叙述中,才能做出明智的决策。以搜索和救援行动为例,工作人员必须快速综合来自文本、照片和 GPS 数据的信息来制定策略。多模态生成式 AI 模型的最新进展通过将这些不同输入整合并综合到一个统一、全面的视图中,使用户能够更好地完成任务。例如,我们研究中的一位参与者通过使用生成式 AI 模型将科学出版物中的文本与视觉基因结构描述相结合来说明这种能力。这种整合可以创建一个图像,将个人的基因变异置于记录变异的背景中。这种先进的综合使得用户能够简明地捕捉复杂的关系和见解,从而简化决策制定,并扩大在各个领域产生创新解决方案的潜力。
AI 助理的意义构建过程

结论
我们探讨了生成式 AI 支持遗传学专业人员诊断罕见病所具有的潜力。通过设计一个基于 AI 的助理,我们的目标是精简全基因组测序分析,帮助专业人员更有效地诊断罕见的遗传疾病。我们的研究分两个关键阶段展开:确定分析中现有的挑战,以及设计构思,在此阶段我们创建了一个原型 AI 助理。该工具旨在通过标记需要重新分析的病例和综合关键的基因和变异数据来提高诊断率并缩短诊断时间。尽管取得了宝贵的发现,但仍需要更多的研究。未来的研究将涉及与遗传学专业人员进行实时的、基于任务的用户测试,以评估 AI 对他们工作流程的影响。AI 进步的承诺在于解决正确的用户问题并构建适当的解决方案,这一切都需要模型开发者、领域专家、系统设计师和人机交互研究人员之间的协作来实现。通过促进这些合作,我们的目标是开发出针对特定领域的强大、个性化的 AI 助理。
加入讨论
欢迎加入我们,继续探索生成式 AI 在基因分析中变革性的潜力,请在此处阅读完整的出版物文本:这里 (在新标签页中打开)。在社交媒体上关注我们,与您的网络分享这篇文章,并让我们知道您对 AI 如何改变基因研究的看法。如果您对我们的 o... [内容被截断]
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区