📢 转载信息

原文链接：https://www.microsoft.com/en-us/research/blog/using-ai-to-assist-in-rare-disease-diagnosis/

原文作者：Mandi Hall, Ashley Conard (Microsoft Research)

利用人工智能辅助罕见病诊断：微软研究院的创新探索

在快速发展的基因分析领域，准确解读全基因组测序数据对于诊断罕见遗传病并改善患者预后至关重要。然而，尽管技术不断进步，遗传学专业人士在管理和综合分析这些海量数据时仍面临巨大挑战。不到 50% 的初始病例能得到确诊，而重新分析虽然可能带来新发现，但过程依然耗时且复杂。

为了更好地理解和解决这些挑战，微软研究院与德雷塞尔大学（Drexel University）和布罗德研究所（Broad Institute）合作，进行了一项名为AI-Enhanced Sensemaking: Exploring the Design of a Generative AI-Based Assistant to Support Genetic Professionals (AI 增强的意义构建：探索生成式 AI 助手支持遗传学专业人士的设计) (opens in new tab)的综合研究。该研究最近发表在《ACM 交互式智能系统汇刊》关于生成式 AI 的特刊上。

该研究专注于整合生成式 AI，以支持全基因组测序分析中复杂、耗时且信息密集的“意义构建”（sensemaking）任务。通过详细的实证研究和与领域专家的协作设计会议，我们确定了遗传学专业人士面临的关键障碍，并提出了由 AI 驱动的解决方案，以增强他们的工作流程。我们制定了生成式 AI 如何帮助综合生物医学数据，从而实现 AI 与专家协作，增加先前未解决的罕见病诊断的策略——最终目标是改善患者的生活质量和预期寿命。

全基因组测序在罕见病诊断中的作用

罕见病影响着全球多达五亿人，而获得诊断可能需要数年时间。这些诊断通常涉及专家会诊、实验室检测、影像学检查和侵入性程序。全基因组测序通过将患者的 DNA 序列与参考基因组进行比较，用于识别导致这些疾病的基因变异。遗传学专业人员使用诸如 seqr（一个用于罕见病病例分析和项目管理的开源、基于 Web 的工具）等生物信息学工具来帮助他们过滤和优先处理超过 100 万个变异，以确定它们在疾病中的潜在作用。他们工作中的一个关键组成部分是“意义构建”：即搜索、过滤和综合数据，以从复杂的基因和变异信息集中构建、完善和呈现模型的过程。

多步骤的测序过程通常需要三到 12 周，并且需要大量的证据和时间来综合和聚合信息，以了解基因和变异对患者的影响。如果患者的病例未能解决，其全基因组测序数据将被搁置，直到有足够的时间进行重新分析。这造成了患者病例的积压。能够轻松识别新科学证据出现的时间以及何时重新分析未解决的病例，是缩短患者在未知罕见病诊断下痛苦时间的关键。

AI 系统辅助复杂人类任务的潜力

大约 87% 的 AI 系统从未投入使用，仅仅是因为它们解决了错误的问题。理解不同类型专业人士所需的 AI 支持、他们当前的工作流程以及 AI 的能力，对于 AI 系统的成功部署和使用至关重要。在 AI 设计中，将技术能力与用户任务相匹配尤其具有挑战性，因为 AI 模型可以生成众多输出，并且其能力可能不明确。要设计一个有效的 AI 辅助系统，需要识别 AI 可以支持的任务，确定适当的 AI 介入水平，并设计用户与 AI 的交互方式。这要求考虑人类如何与技术互动，以及如何最好地将 AI 纳入工作流程和工具中。

播客系列

Illustrated headshots of Daniel Carpenter, Timo Minssen, Chad Atalla, and Kathleen Sullivan for the Microsoft Research Podcast

AI 测试与评估：科学与行业的经验教训

了解微软如何借鉴其他领域的经验，推进测试和评估作为 AI 治理支柱的发展。

立即收听

Opens in a new tab

研究目标与基因 AI 助手的共同设计

我们的研究旨在了解遗传学专业人士在执行全基因组测序分析时面临的当前挑战和需求，并探索他们希望 AI 助手能在哪些任务上提供支持。研究的第一阶段是通过访谈 17 名遗传学专业人士，以更好地了解他们的工作流程、工具和挑战。他们包括直接参与数据解读的遗传分析师以及参与全基因组测序的其他角色。在研究的第二阶段，我们与研究参与者就 AI 助手如何支持其工作流程进行了共同设计会议。随后，我们开发了 AI 助手的原型，并在后续的设计回顾会议中与研究参与者一起对其进行了测试和完善。

确定全基因组测序分析中的挑战

通过对遗传学专业人士的深入访谈，我们的研究揭示了全基因组测序分析中的三个关键挑战：

信息过载（Information Overload）：遗传分析师需要从多个来源收集和综合海量数据。这项任务非常耗时，且容易出现人为错误。
协作共享（Collaborative Sharing）：与该领域其他人分享发现可能既麻烦又效率低下，通常依赖于过时的方法，从而减慢了协作分析过程。
重新分析的优先级排序（Prioritizing Reanalysis）：鉴于新科学发现的持续涌入，对未解决病例进行重新分析的优先级排序是一项艰巨的挑战。分析师需要一种系统化的方法来识别最能从重新分析中受益的病例。

遗传学专业人士强调了从不同数据源收集和综合基因和变异信息所花费的大量时间。其他遗传学专业人士可能对某些基因和变异有见解，但与他人分享和解读信息以进行协作意义构建需要大量的时间和精力。尽管新科学发现可能通过重新分析影响未解决的病例，但根据新发现确定病例的优先级在病例数量和遗传学专业人员有限的时间内具有挑战性。

与专家共同设计和 AI-人意义构建任务

我们的研究参与者优先考虑了 AI 助手的两个潜在任务。第一个任务是根据新科学发现标记需要重新分析的病例。该助手将提醒分析师哪些未解决的病例可以从新的研究中受益，并提供从最新出版物中提取的相关更新。第二个任务侧重于从科学文献中汇总和综合有关基因和变异的信息。此功能将从众多科学论文中编译关于基因和变异的基本信息，以用户友好的格式呈现，为分析师节省大量时间和精力。参与者强调需要在他们审查的证据中平衡选择性和全面性。他们还设想与其他遗传学专业人士合作，解释、编辑和验证 AI 助手生成的工件（artifacts）。

遗传学专业人员在工作流程的不同阶段都需要广泛和集中的证据。AI 助手原型旨在允许灵活过滤和彻底的证据聚合，确保用户可以深入研究全面的数据或有选择地关注相关细节。原型包括协作意义构建功能，使用户能够集体解释、编辑和验证 AI 生成的信息。这种方法不仅强调了 AI 输出的可信度，还促进了遗传学专业人员之间的共同理解和决策制定。

专家-AI 意义构建的设计启示

在基因组序列分析不断变化的前沿领域，利用生成式 AI 增强意义构建提供了引人入胜的可能性。保持最新、综合来自不同来源的信息并做出明智的决策是一项具有挑战性的任务。

我们的研究参与者强调了在不丢失关键组成部分的情况下整合来自多个来源数据的困难、记录决策依据以及培养协作环境的障碍。生成式 AI 模型凭借其先进的能力，已经开始通过自动生成交互式工件来支持意义构建来应对这些挑战。然而，此类系统的有效性取决于仔细的设计考虑，尤其是在它们如何促进分布式意义构建、支持初始和持续的意义构建，以及结合来自多种模态的证据方面。接下来，我们将讨论使用生成式 AI 模型支持意义构建的三个设计考量。

分布式专家-AI 意义构建设计

生成式 AI 模型可以创建有助于个人用户意义构建过程的工件；然而，真正的潜力在于在用户之间共享这些工件，以促进集体理解和效率。我们研究的参与者强调了在与 AI 生成内容交互时，可解释性、反馈和信任的重要性。信任是通过查看被其他用户标记为正确的部分工件，或观察对 AI 生成信息的编辑来实现的。然而，一些用户警告不要过度依赖 AI，这可能会掩盖潜在的错误。因此，设计策略应确保任何更正都得到清晰的标记和注释。此外，为了增强分布式意义构建，对他人笔记的可见性以及通过 AI 进行的特定于上下文的综合可以简化该过程。

初始专家-AI 意义构建和再意义构建设计

在我们快节奏、信息驱动的世界中，理解一个情况的初始状态以及当新信息出现时对其进行重新理解至关重要。意义构建本质上是时间性的，它反映并塑造了我们对时间的理解，因为我们重新访问任务以重新评估过去的决定或纳入新信息。生成式 AI 在此发挥着关键作用，它将静态数据转化为动态演变的工件，提供了对过去推理过程的全面视图。这种 AI 生成的工件提供了连续性，允许用户——无论是原始决策者还是新个体——访问早期任务实例中决策背后的理由。通过持续编辑和更新这些工件，生成式 AI 会突出自上次审查以来出现的新信息，从而支持持续的理解和决策制定。此外，AI 系统通过总结先前的笔记和问题来增强透明度，提供对早期思维过程的见解，并促进对结论如何得出的更深入理解。这种反思能力不仅可以加强初始意义构建工作，还可以使用户在出现新数据时获得进行知情再意义构建所需的清晰度。

结合多种模态证据以增强 AI-专家意义构建

结合多种模态证据的能力对于有效的意义构建至关重要。用户通常需要将文本、图像、空间坐标等不同类型的数据整合到一个连贯的叙述中，以做出明智的决策。以搜救行动为例，工作人员必须快速综合来自文本、照片和 GPS 数据的信息来制定策略。多模态生成式 AI 模型的最新进展通过将这些不同输入整合并综合到一个统一、全面的视图中，使用户能够应对这些挑战。例如，我们研究中的一位参与者通过使用生成式 AI 模型将科学出版物的文本与视觉基因结构描述相结合来说明这种能力。这种集成可以创建一个图像，将个人的基因变异置于已记录变异的背景中进行情境化。这种先进的综合能力使用户能够简明扼要地捕捉复杂的关系和见解，简化决策制定，并扩大跨不同领域创新解决方案的潜力。

带 AI 助手的意义构建过程

Figure: Sensemaking process when interpreting variants with the introduction of prototype AI assistant. Gray boxes represent sensemaking activities which are currently performed by an analyst but are human-in-the-loop processes with involvement of our prototype AI assistant. Non-gray boxes represent activities reserved for analyst completion without assistance by our AI assistant prototype. Within the foraging searching and synthesizing processes, examples of data sources and data types for each, respectively, are connected by dotted lines. — 图示：在引入原型 AI 助手后，解读变异的意义构建过程。灰色框代表目前由分析师执行但需 AI 助手参与的人机协作（Human-in-the-loop）意义构建活动。非灰色框代表不依赖 AI 助手原型协助、由分析师独立完成的活动。在信息搜寻、搜索和综合过程中，数据源和对应的数据类型示例通过虚线连接。

结论

我们探讨了生成式 AI 支持遗传学专业人士诊断罕见疾病的潜力。通过设计一个 AI 辅助助手，我们的目标是简化全基因组测序分析，帮助专业人员更有效地诊断罕见遗传病。我们的研究分两个关键阶段展开：确定分析中现有的挑战，以及设计构思，在此阶段我们创建了 AI 助手原型。该工具旨在通过标记需要重新分析的病例和综合关键的基因和变异数据来提高诊断率并缩短诊断时间。尽管取得了宝贵的发现，但仍需要更多的研究。未来的研究将涉及与遗传学专业人员进行实时的、基于任务的用户测试，以评估 AI 对他们工作流程的影响。AI 进步的承诺在于解决正确的用户问题并构建适当的解决方案，这是通过模型开发者、领域专家、系统设计师和 HCI 研究人员之间的协作实现的。通过促进这些合作，我们的目标是开发出针对特定领域量身定制的、强大且个性化的 AI 助手。

加入讨论

欢迎加入我们，继续探索生成式 AI 在基因分析中变革性的潜力，并请点击此处阅读完整出版物 (opens in new tab)。在社交媒体上关注我们，与您的同行分享这篇文章，并告诉我们您对 AI 如何改变基因研究的看法。如果您对我们的 o... [内容被截断]

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，小白也可以简单操作。

青云聚合API官网https://api.qingyuntop.top

支持全球最新300+模型：https://api.qingyuntop.top/pricing

详细的调用教程及文档：https://api.qingyuntop.top/about

目录CONTENT

AI 赋能罕见病诊断：微软研究院探索生成式 AI 助手如何助力基因专业人士