目 录CONTENT

文章目录

AI助力罕见病诊断:微软研究探索生成式AI在基因专业人士工作流程中的应用

Administrator
2025-10-13 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.microsoft.com/en-us/research/blog/using-ai-to-assist-in-rare-disease-diagnosis/

原文作者:Mandi Hall, Ashley Conard


利用人工智能辅助罕见病诊断:微软研究探索生成式AI赋能基因专业人员

发布时间:2025年9月22日

在快速发展的基因分析领域,准确解读全基因组测序(WGS)数据对于诊断罕见遗传病并改善患者预后至关重要。然而,尽管技术不断进步,基因专业人士在管理和综合分析海量数据方面仍面临巨大挑战。目前,少于50%的初始病例能够获得确诊,即便进行再分析也耗时耗力,且过程复杂。

为了更好地理解和解决这些挑战,微软研究院与德雷塞尔大学(Drexel University)和布罗德研究所(Broad Institute)合作,进行了一项题为《AI增强的意义构建:探索基于生成式AI的助手设计以支持基因专业人员》AI-Enhanced Sensemaking: Exploring the Design of a Generative AI-Based Assistant to Support Genetic Professionals (opens in new tab))的综合研究。该研究近期发表在《ACM人机交互智能系统汇刊》(ACM Transactions on Interactive Intelligent Systems)关于生成式AI的特刊上。

本次研究的重点是将生成式AI集成到全基因组测序分析中复杂、耗时且信息密集的过程——即“意义构建”(sensemaking)中。通过详细的实证研究和与领域专家的协作设计环节,我们识别了基因专业人员面临的关键障碍,并提出了由AI驱动的解决方案来增强其工作流程。我们开发了利用生成式AI综合生物医学数据、促进AI与专家协作以提高先前未解决的罕见病诊断率的策略,最终目标是改善患者的生活质量和预期寿命。

Icons representing individual and group connections to a central computer monitor with a globe, symbolizing online connectivity, set against a gradient background transitioning from blue to pink.

罕见病诊断中的全基因组测序

罕见病影响着全球多达五亿人,而获得诊断可能需要数年时间。这些诊断通常涉及专家咨询、实验室检查、影像学研究和侵入性操作。全基因组测序通过将患者的DNA序列与参考基因组进行比较,用于识别引起这些疾病的基因变异。基因专业人员使用seqr等生物信息学工具——一个用于罕见病病例分析和项目管理的开源网络工具——来帮助他们筛选和优先排序超过100万个变异体,以确定其在疾病中的潜在作用。他们工作中的关键组成部分是“意义构建”:搜索、筛选和综合数据,以从复杂的基因和变异信息集中构建、完善和呈现模型的过程。

多步骤的测序过程通常需要三到十二周,并且需要大量证据和时间来综合和汇总信息,以理解基因和变异对患者的影响。如果患者的病例未得到解决,其全基因组测序数据就会被搁置,直到有足够的时间进行重新分析。这造成了患者病例的积压。能够轻松识别新科学证据出现的时间以及何时重新分析未解决的病例,是缩短患者在未知罕见病诊断下痛苦时间的关键。

AI系统在复杂人类任务中展现的潜力

大约87%的AI系统从未投入实际部署,原因仅仅是它们解决了错误的问题。理解不同类型专业人员所需的AI支持、他们当前的工作流程以及AI的能力,对于成功部署和使用AI系统至关重要。在AI设计中,将技术能力与用户任务相匹配尤其具有挑战性,因为AI模型可以产生大量输出,且其能力往往不明确。要设计一个有效的AI系统,需要识别AI可以支持的任务,确定适当的AI介入程度,并设计人机交互方式。这要求考虑人类如何与技术互动,以及如何最好地将AI融入工作流程和工具中。

聚焦:活动系列

微软研究院论坛

欢迎参加关于通用人工智能时代研究的持续思想交流。点播观看前四集。

Opens in a new tab

研究目标与基因AI助手的共同设计

我们的研究旨在了解基因专业人员在进行全基因组测序分析时的当前挑战和需求,并探索他们希望AI助手在哪些任务上提供支持。研究的第一阶段,我们访谈了17名遗传学专业人士,以深入了解他们的工作流程、工具和挑战,其中包括直接参与数据解释的基因分析师以及参与全基因组测序的其他角色。在第二阶段,我们与研究参与者进行了协同设计会议,探讨AI助手如何支持他们的工作流程。随后,我们开发了一个AI助手原型,并在后续的设计回顾会议中与参与者一起对其进行了测试和完善。

识别全基因组测序分析中的挑战

通过对基因专业人员的深入访谈,我们的研究发现了全基因组测序分析中的三个关键挑战:

  1. 信息过载:基因分析师需要从多个来源收集和综合海量数据。这项任务非常耗时,且容易出现人为错误。
  2. 协作共享:与领域内其他人共享研究发现的过程繁琐且效率低下,通常依赖过时的方法,减慢了协作分析的进程。
  3. 再分析优先级排序:鉴于新科学发现的持续涌入,优先对未解决的病例进行再分析是一项艰巨的挑战。分析师需要一种系统性的方法来确定最能从再分析中获益的病例。

基因专业人员强调了从不同数据源收集和综合基因和变异信息的耗时性。其他基因专业人员可能对某些基因和变异有见解,但要与他人共享和解释信息以进行协作意义构建,需要大量的时间和精力。尽管新科学发现可以通过再分析影响未解决的病例,但鉴于未解决病例的数量和基因专业人员有限的时间,根据新发现对病例进行优先级排序具有挑战性。

与专家共同设计和人机意义构建任务

我们的研究参与者优先考虑了AI助手的两个潜在任务。第一个任务是根据新科学发现标记需要再分析的病例。该助手将提醒分析师哪些未解决的病例可能受益于新的研究,并提供从最新出版物中提取的相关更新。第二个任务侧重于从科学文献中汇总和综合有关基因和变异的信息。此功能将从众多科学论文中汇编关于基因和变异的基本信息,以用户友好的格式呈现,从而为分析师节省大量时间和精力。参与者强调了在审查证据时需要在选择性和全面性之间取得平衡的必要性。他们还设想与其他基因专业人员协作,解释、编辑和验证AI助手生成的工件(artifacts)。

基因专业人员在其工作流程的不同阶段都需要广泛和集中的证据。AI助手原型被设计为允许灵活筛选和彻底的证据汇总,确保用户可以深入研究全面的数据或有选择地关注相关细节。原型包含了协作意义构建的功能,使用户能够集体解释、编辑和验证AI生成的信息。这种方法不仅强调了AI输出的可信度,还促进了基因专业人员之间的共同理解和决策制定。

专家-AI意义构建的设计启示

在基因序列分析不断变化的前沿,利用生成式AI增强意义构建提供了引人入胜的可能性。保持信息更新、综合来自不同来源的信息并做出明智决策是一项具有挑战性的任务。

我们的研究参与者强调了在不丢失关键组成部分的情况下整合来自多个来源数据的困难、记录决策理由以及培养协作环境的障碍。生成式AI模型凭借其先进的能力,已开始通过自动生成交互式工件来支持意义构建,从而应对这些挑战。然而,此类系统的有效性取决于仔细的设计考量,特别是在它们如何促进分布式意义构建、支持初始意义构建和持续意义构建,以及如何组合来自多种模态的证据方面。接下来,我们将讨论使用生成式AI模型支持意义构建的三个设计考量。

分布式专家-AI意义构建设计

生成式AI模型可以创建有助于个体用户意义构建过程的工件;然而,真正的潜力在于在用户之间共享这些工件,以促进集体理解和效率。我们研究中的参与者强调了在与AI生成内容交互时,可解释性、反馈和信任的重要性。信任是通过查看被其他用户标记为正确的工件部分,或观察对AI生成信息的编辑而获得的。然而,一些用户警告不要过度依赖AI,这可能会掩盖潜在的错误。因此,设计策略应确保任何更正都被清晰地标记和注释。此外,为了增强分布式意义构建,其他人的注释的可见性以及AI提供的特定于上下文的综合信息可以简化该过程。

初始专家-AI意义构建与再意义构建设计

在我们快节奏、信息驱动的世界中,理解情况的“初始”状态以及在新信息出现时进行“再次”理解至关重要。意义构建本质上是时间性的,反映并塑造了我们对时间的理解,因为我们重新审视任务以重新评估过去的决策或纳入新信息。生成式AI在此处发挥着关键作用,它将静态数据转换为动态演变的工件,提供对过去推理的全面视图。这种AI生成的工件提供了连续性,使用户——无论是原始决策者还是新加入的人员——都能获取早期任务实例中决策背后的理由。通过持续编辑和更新这些工件,生成式AI突出了自上次审查以来出现的新信息,支持持续的理解和决策制定。此外,AI系统通过总结先前的注释和问题来增强透明度,提供对早期思维过程的见解,从而促进对结论是如何得出的更深入理解。这种反思能力不仅可以加强初始的意义构建工作,还可以为用户提供在出现新数据时进行明智的再意义构建所需的清晰度。

结合多模态证据以增强AI-专家意义构建

结合来自多种模态的证据的能力对于有效的意义构建至关重要。用户通常需要将不同类型的数据——文本、图像、空间坐标等——整合到一个连贯的叙述中,以做出明智的决策。以搜索和救援行动为例,工作人员必须快速综合文本、照片和GPS数据等信息来制定策略。多模态生成式AI模型的最新进展通过整合和综合这些多样化的输入到一个统一的、全面的视图中,增强了用户能力。例如,我们研究中的一位参与者说明了这种能力,他使用生成式AI模型将科学出版物的文本与视觉基因结构图景合并。这种集成可以生成一个图像,将个体患者的基因变异置于已记录变异的背景中进行情境化。这种先进的综合使得用户能够简明地捕捉复杂的关联和见解,简化决策过程,并扩大跨不同领域创新解决方案的潜力。

AI助手下的意义构建过程

Figure: Sensemaking process when interpreting variants with the introduction of prototype AI assistant. Gray boxes represent sensemaking activities which are currently performed by an analyst but are human-in-the-loop processes with involvement of our prototype AI assistant. Non-gray boxes represent activities reserved for analyst completion without assistance by our AI assistant prototype. Within the foraging searching and synthesizing processes, examples of data sources and data types for each, respectively, are connected by dotted lines.

图示:在引入原型AI助手后解释变异体的意义构建过程。灰色框代表目前由分析师执行但有人工干预(Human-in-the-loop)的意义构建活动,涉及我们原型AI助手的参与。非灰色框代表不涉及我们AI助手原型协助、由分析师独立完成的活动。在信息探寻(foraging)、搜索(searching)和综合(synthesizing)过程中,数据源和数据类型的示例由虚线连接。

结论

我们探讨了生成式AI在诊断罕见病方面支持基因专业人员的潜力。通过设计一个AI辅助系统,我们的目标是简化全基因组测序分析,帮助专业人员更有效地诊断罕见遗传病。我们的研究分为两个关键阶段:确定分析中现有的挑战,以及设计构思阶段,在此阶段我们制作了AI助手原型。该工具旨在通过标记需要再分析的病例并综合关键的基因和变异数据来提高诊断率并缩短诊断时间。尽管取得了宝贵的发现,但仍需要更多的研究。未来的研究将涉及与基因专业人员进行实时的、基于任务的用户测试,以评估AI对其工作流程的影响。AI进步的希望在于解决正确的用户问题,并通过模型开发者、领域专家、系统设计师和人机交互研究人员之间的协作来实现适当的解决方案。通过促进这些合作,我们旨在开发出适合特定领域的稳健、个性化的AI助手。

加入对话

请加入我们,继续探索生成式AI在基因分析中变革性的潜力,并请点击此处阅读完整出版物(opens in new tab)。在社交媒体上关注我们,与您的同行分享这篇文章,并告诉我们您对AI如何改变基因研究的看法。如果您对我们其他相关研究工作感兴趣,请查看https://www.biorxiv.org/content/10.1101/2025.03... [内容被截断]




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。

青云聚合API官网https://api.qingyuntop.top

支持全球最新300+模型:https://api.qingyuntop.top/pricing

详细的调用教程及文档:https://api.qingyuntop.top/about

0

评论区