📢 转载信息
原文链接:https://www.microsoft.com/en-us/research/blog/using-ai-to-assist-in-rare-disease-diagnosis/
原文作者:Mandi Hall, Ashley Conard
利用AI辅助罕见病诊断:加速基因组学分析,提升诊断效率
在快速发展的基因分析领域,准确解读全基因组测序数据对于诊断罕见遗传病并改善患者预后至关重要。然而,尽管技术不断进步,基因专业人员在管理和综合分析这些海量数据时仍面临巨大挑战。不到50%的初始病例能获得诊断,即使是再分析也耗时耗力且过程复杂。
为了更好地理解并应对这些挑战,微软研究院与德雷塞尔大学(Drexel University)和布罗德研究所(Broad Institute)合作,进行了一项综合研究,题为《AI增强的意义构建:探索基于生成式AI的助手设计以支持基因专业人员》(AI-Enhanced Sensemaking: Exploring the Design of a Generative AI-Based Assistant to Support Genetic Professionals (opens in new tab))。该研究最近发表在《ACM 交互式智能系统汇刊》的生成式AI特刊上。
该研究专注于整合生成式AI,以支持全基因组测序分析中复杂、耗时且信息密集的意义构建(sensemaking)任务。通过详细的实证研究和与领域专家的协作设计会议,我们确定了基因专业人员面临的关键障碍,并提出了由AI驱动的解决方案,以增强他们的工作流程。我们制定了生成式AI如何帮助综合生物医学数据、实现AI与专家协作以提高以往未解决的罕见病诊断率的策略,最终目标是改善患者的生活质量和预期寿命。
罕见病诊断中的全基因组测序
罕见病影响着全球多达五亿人,获得诊断往往需要数年时间。这些诊断通常涉及专科会诊、实验室检查、影像学研究和侵入性程序。全基因组测序通过将患者的DNA序列与参考基因组进行比较,用于识别导致这些疾病的遗传变异。基因专业人员使用像seqr这样的生物信息学工具(一个用于罕见病病例分析和项目管理的开源Web工具),帮助他们过滤和优先处理超过100万个变异,以确定它们在疾病中的潜在作用。他们工作的一个关键组成部分是“意义构建”:搜索、过滤和综合数据的过程,以便从复杂的基因和变异信息集中建立、完善和展示模型。
多步骤的测序过程通常需要三到十二周,需要大量证据和时间来综合和汇总信息,以理解基因和变异对患者的影响。如果患者的病例无法解决,其全基因组测序数据将被搁置,直到有足够的时间进行重新分析。这造成了积压的病例。能够轻松识别新科学证据出现的时间以及何时重新分析未解决的病例,是缩短患者在未知罕见病诊断中受苦时间的关键。
AI系统协助复杂人类任务的潜力
大约87%的AI系统从未投入使用,仅仅因为它们解决了错误的问题。理解不同类型专业人员所需的AI支持、他们当前的工作流程以及AI能力,对于成功部署和使用AI系统至关重要。在AI设计中,将技术能力与用户任务相匹配尤其具有挑战性,因为AI模型可以产生许多输出,且其能力可能不明确。要设计一个有效的AI系统,需要确定AI可以支持的任务,确定适当的AI介入程度,并设计人机交互。这需要考虑人类如何与技术交互,以及如何最好地将AI融入工作流程和工具中。
Opens in a new tab研究目标与基因AI助手的共同设计
我们的研究旨在了解基因专业人员在进行全基因组测序分析时的当前挑战和需求,并探索他们希望AI助手在哪些任务上提供支持。研究的第一阶段,我们访谈了17位基因专业人员,以更好地理解他们的工作流程、工具和挑战,其中包括直接参与数据解读的基因分析师以及参与全基因组测序的其他角色。在研究的第二阶段,我们与研究参与者进行了共同设计会议,讨论AI助手如何支持他们的工作流程。随后,我们开发了一个AI助手的原型,并在后续的设计演练会议中与研究参与者一起对其进行了测试和完善。
识别全基因组测序分析中的挑战
通过对基因专业人员的深入访谈,我们的研究发现了全基因组测序分析中的三个关键挑战:
- 信息过载:基因分析师需要从多个来源收集和综合海量数据。这项任务非常耗时,并且容易出现人为错误。
- 协作共享:与领域内其他人共享发现的过程可能很麻烦且效率低下,通常依赖于过时的方法,从而减慢了协作分析过程。
- 重新分析的优先级排序:鉴于新科学发现的持续涌入,优先对未解决的病例进行重新分析是一项艰巨的挑战。分析师需要一种系统化的方法来识别最能从重新分析中受益的病例。
基因专业人员强调了从不同数据源收集和综合基因和变异信息所花费的时间。其他基因专业人员可能对某些基因和变异有见解,但与他人共享和解释信息以进行协作意义构建需要大量的时间和精力。尽管新的科学发现可能通过重新分析影响未解决的病例,但鉴于未解决病例的数量和基因专业人员有限的时间,根据新发现确定病例优先级具有挑战性。
与专家共同设计和人机意义构建任务
我们的研究参与者优先考虑了AI助手的两个潜在任务。第一个任务是根据新的科学发现标记需要重新分析的病例。该助手将向分析师发出警报,指出可能受益于新研究的未解决病例,并提供从最新出版物中提取的相关更新。第二个任务侧重于从科学文献中汇总和综合有关基因和变异的信息。此功能将从众多科学论文中汇编关于基因和变异的基本信息,以用户友好的格式呈现,从而为分析师节省大量时间和精力。参与者强调需要在所审查的证据中平衡选择性与全面性。他们还设想与同事合作,解释、编辑和验证AI助手生成的工件。
基因专业人员在工作流程的不同阶段都需要广泛和集中的证据。AI助手原型旨在允许灵活过滤和彻底的证据聚合,确保用户可以深入研究全面的数据或选择性地关注相关细节。原型包括协作意义构建功能,使用户能够集体解释、编辑和验证AI生成的信息。这种方法不仅强调了AI输出的可信度,还促进了基因专业人员之间的共同理解和决策。
专家-AI意义构建的设计启示
在基因组序列分析不断变化的前沿领域,利用生成式AI来增强意义构建提供了引人入胜的可能性。保持知识更新、综合来自不同来源的信息并做出明智决策的任务是充满挑战的。
我们的研究参与者强调了在不丢失关键组成部分的情况下整合来自多个来源数据、记录决策依据以及培养协作环境方面的障碍。生成式AI模型以其先进的能力,已经开始通过自动生成交互式工件来支持意义构建来解决这些挑战。然而,此类系统的有效性取决于仔细的设计考虑,特别是在它们如何促进分布式意义构建、支持初始和持续的意义构建,以及如何组合来自多种模态的证据方面。接下来,我们将讨论使用生成式AI模型支持意义构建的三个设计考量。
分布式专家-AI意义构建设计
生成式AI模型可以创建有助于个体用户意义构建过程的工件;然而,真正的潜力在于在用户之间共享这些工件,以促进集体理解和效率。我们研究的参与者强调了在与AI生成内容交互时,可解释性、反馈和信任的重要性。信任是通过查看被其他用户标记为正确的工件部分,或观察对AI生成信息的编辑而获得的。然而,一些用户警告不要过度依赖AI,因为这可能会掩盖潜在的错误。因此,设计策略应确保任何更正都得到清晰的标记和注释。此外,为了增强分布式意义构建,他人的笔记的可视化以及通过AI进行的特定于上下文的综合可以简化流程。
初始专家-AI意义构建和再意义构建设计
在我们快节奏、信息驱动的世界中,理解情况的“初始状态”以及新信息出现后的状态至关重要。意义构建本质上是时间的,反映并塑造我们对时间的理解,因为我们重新访问任务以重新评估过去的决定或纳入新信息。生成式AI在这里发挥着关键作用,它将静态数据转变为不断发展的动态工件,提供了对过去推理的全面视图。这种AI生成的工件提供了连续性,允许用户——无论是原始决策者还是新个体——访问早期任务实例中决策背后的推理。通过持续编辑和更新这些工件,生成式AI突出了自上次审查以来出现的新信息,支持持续的理解和决策制定。此外,AI系统通过总结先前的笔记和问题来增强透明度,提供对早期思维过程的见解,并促进对结论得出方式的深入理解。这种反思能力不仅可以加强初始的意义构建工作,还可以使拥有清晰度所需的资源,以便在新数据出现时进行知情的再意义构建。
结合来自多种模态的证据以增强AI-专家意义构建
结合来自多种模态的证据的能力对于有效的意义构建至关重要。用户通常需要将不同类型的数据——文本、图像、空间坐标等——整合到一个连贯的叙述中,以做出明智的决策。以搜索和救援行动为例,工作人员必须快速综合来自文本、照片和GPS数据的信息来制定战略。多模态生成式AI模型的最新进展通过将这些不同的输入纳入统一的、全面的视图,使用户能够整合和综合这些不同的输入。例如,我们研究中的一位参与者说明了这种能力,即将科学出版物的文本与基因结构的视觉描述相结合。这种整合可以创建一个图像,将个体基因变异置于已记录变异的背景中进行情境化。这种先进的综合使得用户能够简明地捕捉复杂的关系和见解,简化决策过程,并扩大跨不同领域创新的潜力。
AI助手意义构建流程

结论
我们探讨了生成式AI支持基因专业人员诊断罕见病的潜力。通过设计一个基于AI的助手,我们的目标是简化全基因组测序分析,帮助专业人员更有效地诊断罕见遗传病。我们的研究分两个关键阶段展开:确定分析中现有的挑战,以及设计构思,在此阶段我们制作了一个AI助手原型。该工具旨在通过标记需要重新分析的病例并综合关键的基因和变异数据,提高诊断率并缩短诊断时间。尽管取得了宝贵的研究成果,但仍需要更多的研究。未来的研究将涉及使用基于任务的实时用户测试来评估AI助手对其工作流程的影响。AI进步的承诺在于解决正确的用户问题并构建适当的解决方案,这需要模型开发者、领域专家、系统设计者和人机交互研究人员之间的合作。通过促进这些合作,我们的目标是开发出稳健的、针对特定领域的个性化AI助手。
加入对话
请加入我们,继续探索生成式AI在基因分析中变革性的潜力,并请点击此处 (opens in new tab)阅读完整的出版文本。在社交媒体上关注我们,与您的网络分享这篇文章,并告诉我们您对AI如何改变基因研究的看法。如果您对我们其他相关的研究工作感兴趣,请查看证据聚合器:应用于罕见病诊断的AI推理 (Evidence Aggregator: AI reasoning applied to rare disease diagnosis). (opens in new tab)
Opens in a new tab🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区