📢 转载信息
原文链接:https://news.mit.edu/2025/new-ai-system-could-accelerate-clinical-research-0925
原文作者:Adam Zewe | MIT News
🔬 突破性AI工具:加速医疗影像分析,推动临床研究进程
通过实现对医学图像中感兴趣区域的快速标注,MIT研究人员开发的新型AI工具,能够有效帮助科学家研究新疗法或绘制疾病进展图谱。

图注:MIT研究人员开发了一种基于人工智能的新工具,可以快速标注医学图像中的感兴趣区域,有助于研究新疗法或绘制疾病进展图谱。
在进行涉及生物医学图像的新研究时,对医学图像中感兴趣区域进行标注(即分割)通常是临床研究人员迈出的第一步。
例如,为了确定患者海马体的大小如何随着年龄变化,科学家首先需要在海马体的一系列脑部扫描中勾勒出其轮廓。对于许多结构和图像类型来说,这是一个耗时的人工过程,尤其当待研究的区域难以清晰界定时,耗时更甚。
✨ 交互式AI:告别人工分割的繁琐
为了简化这一流程,麻省理工学院(MIT)的研究人员开发了一个人工智能系统,它允许研究人员通过在图像上进行点击、涂写和绘制方框等交互操作,快速对新的生物医学影像数据集进行分割。该新型AI模型利用这些交互来预测所需的分割结果。
随着用户对更多图像进行标记,他们需要的交互次数会逐渐减少,最终降至零。届时,该模型可以准确地分割每一张新图像,无需用户输入。
它之所以能做到这一点,是因为该模型架构经过专门设计,能够利用它已经分割过的图像信息来进行新的预测。
与其他医学图像分割模型不同的是,这套系统允许用户对整个数据集进行分割,而无需对每张图像重复操作。
此外,这个交互式工具不需要预先分割好的图像数据集来进行训练,因此用户无需具备机器学习专业知识或大量计算资源。他们可以立即将该系统用于新的分割任务,而无需重新训练模型。
从长远来看,该工具可能会加速新治疗方法的研发,并降低临床试验和医学研究的成本。它也可以被医生用于提高临床应用的效率,例如放射治疗计划的制定。
该工具的首席作者、电气工程和计算机科学研究生 Hallee Wong 表示:“许多科学家可能每天只有时间分割几张图像用于研究,因为手动图像分割非常耗时。我们希望这个系统能通过让临床研究人员能够进行他们以前因缺乏高效工具而无法进行的研究,从而催生新的科学发现。”
与Wong共同撰写论文的还有Jose Javier Gonzalez Ortiz(2024届博士)以及计算机科学与人工智能实验室(CSAIL)的研究科学家、哈佛医学院助理教授兼资深作者Adrian Dalca,以及杜加尔德·C·杰克逊计算机科学与电气工程学教授John Guttag。这项研究将在国际计算机视觉会议上发表。
🔄 简化分割流程:MultiverSeg 的优势
研究人员主要使用两种方法来分割新的医学图像集。一种是交互式分割,他们将图像输入AI系统,并通过界面标记感兴趣的区域,模型根据这些交互来预测分割结果。
MIT研究人员之前开发的工具 ScribblePrompt 允许用户进行此操作,但他们必须对每张新图像重复该过程。
另一种方法是开发一个特定任务的AI模型来自动分割图像。这种方法要求用户手动分割数百张图像以创建数据集,然后训练机器学习模型。该模型为新图像预测分割结果。但用户必须为每个新任务从头开始复杂的、基于机器学习的过程,并且无法纠正模型的错误。
这个新的系统,名为 MultiverSeg,结合了这两种方法的优点。它根据用户的涂写等交互来预测新图像的分割结果,同时还将每张已分割的图像保存在一个“上下文集”中,供后续参考。
当用户上传新图像并标记感兴趣的区域时,模型会参考其上下文集中的示例,以更少的用户输入做出更准确的预测。
研究人员将模型的架构设计为可以使用任何大小的上下文集,因此用户不需要固定数量的图像。这使得 MultiverSeg 能够灵活应用于各种场景。
Wong说:“在某些情况下,对于许多任务,您不应该需要提供任何交互。如果您在上下文集中有足够的示例,模型就可以准确地自行预测分割结果。”
研究人员对模型进行了仔细的工程设计和训练,使用了多样化的生物医学影像数据集,以确保它能够根据用户输入逐步改进其预测能力。
用户不需要为他们的数据重新训练或定制模型。要将 MultiverSeg 用于新任务,只需上传新的医学图像并开始标记即可。
当研究人员将 MultiverSeg 与最先进的上下文内和交互式图像分割工具进行比较时,它超越了所有基线模型。
🖱️ 减少点击,提升精度
与其他工具不同,MultiverSeg 随每张图像需要的用户输入更少。到第九张新图像时,它仅需要用户点击两次,就能生成比专为该任务设计的模型更准确的分割结果。
对于某些图像类型,如X射线,用户可能只需要手动分割一两张图像,模型就能达到足够的准确度,可以自行做出预测。
该工具的交互性还使用户能够纠正模型的预测结果,通过迭代直到达到所需的精度水平。与研究人员此前的系统相比,MultiverSeg 仅用约 2/3 的涂写次数和 3/4 的点击次数就达到了 90% 的准确率。
Wong表示:“使用 MultiverSeg,用户可以随时提供更多交互来完善AI的预测结果。这仍然极大地加速了流程,因为修正已有的错误通常比从头开始要快得多。”
展望未来,研究人员希望与临床合作者一起在真实场景中测试该工具,并根据用户反馈进行改进。他们还希望使 MultiverSeg 能够分割三维(3D)生物医学图像。
这项工作得到了台湾广达电脑股份有限公司和美国国立卫生研究院(NIH)的部分支持,以及麻省生命科学中心(Massachusetts Life Sciences Center)提供的硬件支持。
延伸阅读:
- 论文链接:Paper: “MultiverSeg: Scalable Interactive Segmentation of Biomedical Imaging Datasets with In-Context Guidance”
- 项目页面:Project page
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区