📢 转载信息
原文链接:https://www.sciencedaily.com/releases/2026/01/260109023114.htm
原文作者:Stanford Medicine
一个不安稳的夜晚通常会导致第二天的疲劳,但也可能预示着更晚才出现的健康问题。斯坦福医学院及其合作机构的科学家们开发出一种人工智能系统,可以检查一晚的睡眠身体信号,并估计一个人未来患上100多种不同疾病的风险。
该系统名为SleepFM,是使用来自65,000名个体、近600,000小时的睡眠记录进行训练的。这些记录来自多导睡眠图(polysomnography),这是一种深入的睡眠测试,使用多个传感器在睡眠期间跟踪脑电波活动、心功能、呼吸模式、眼球运动、腿部活动和其他生理信号。
睡眠研究蕴含未开发的健康数据
多导睡眠图被认为是评估睡眠的“黄金标准”,通常在实验室环境中进行一夜检测。虽然它被广泛用于诊断睡眠障碍,但研究人员意识到它还捕获了大量很少被充分分析的生理信息。
"当我们研究睡眠时,我们会记录惊人的信号量,"睡眠医学Craig Reynolds教授、新研究的联合作为资深作者Emmanual Mignot医学博士说,该研究将发表在1月6日的《自然医学》杂志上。"这是一种我们研究了八小时的总体生理学,受试者完全处于被约束状态。它的数据非常丰富。"
在常规临床实践中,只有一小部分信息被检查。人工智能的最新进展现在允许研究人员更彻底地分析这些庞大而复杂的数据集。据该团队介绍,这项工作是首次在如此大规模的应用上将人工智能应用于睡眠数据。
"从人工智能的角度来看,睡眠研究相对较少。在许多其他人工智能工作中都在关注病理学或心脏病学,但相对很少关注睡眠,尽管睡眠是生活中如此重要的一部分,"研究的联合作家、生物医学数据科学副教授James Zou博士说。
教AI学习睡眠的模式
为了从数据中挖掘出见解,研究人员构建了一个基础模型(foundation model),这是一种旨在从非常大的数据集中学习普遍模式,然后将这些知识应用于多项任务的人工智能类型。像ChatGPT这样的大型语言模型使用类似的方法,尽管它们是根据生物信号而不是文本进行训练的。
SleepFM使用来自在睡眠诊所就诊患者的多导睡眠图数据,共计585,000小时进行训练。每个睡眠记录被分成五秒的片段,这在训练基于语言的人工智能系统时,其作用类似于“词汇”。
"SleepFM本质上是在学习睡眠的语言,"Zou说。
该模型整合了多种信息流,包括脑电波信号、心率、肌肉活动、脉搏测量和呼吸期间的气流,并学习这些信号如何相互作用。为了帮助系统理解这些关系,研究人员开发了一种称为留一法对比学习(leave-one-out contrastive learning)的训练方法。这种方法一次移除一种信号类型,并要求模型使用剩余的数据来重建它。
"在这项工作中我们做出的技术进步之一是弄清楚如何协调所有这些不同的数据模式,使它们能够汇集起来学习同一种语言,"Zou说。
通过睡眠预测未来疾病
训练完成后,研究人员为特定任务调整了模型。他们首先用标准的睡眠评估进行了测试,例如识别睡眠阶段和评估睡眠呼吸暂停的严重程度。在这些测试中,SleepFM的表现与目前使用的领先模型持平或超越。
然后,团队追求一个更宏大的目标:确定睡眠数据是否可以预测未来疾病。为此,他们将多导睡眠图记录与同一批个体的长期健康结果联系起来。这是因为研究人员能够获取一个睡眠诊所几十年积累的病历。
斯坦福睡眠医学中心由已故的William Dement医学博士于1970年创立,他被公认为睡眠医学之父。用于训练SleepFM的最大群体包括大约35,000名年龄在2到96岁之间的患者。他们的睡眠研究记录于1999年至2024年间在该诊所完成,并与电子健康记录配对,其中一些患者被追踪了长达25年。
(Mignot说,该诊所的多导睡眠图记录可以追溯得更早,但仅以纸质形式存在,他曾在2010年至2019年间担任睡眠中心主任。)
利用这个组合数据集,SleepFM审查了超过1000种疾病类别,并确定了130种可以使用睡眠数据单独以合理准确度预测的疾病。预测结果最好的疾病是癌症、妊娠并发症、循环系统疾病和精神健康障碍,其预测分数超过C指数的0.8。
如何衡量预测准确性
C指数,或称一致性指数(concordance index),衡量模型对风险人群进行排序的能力。它反映了模型在预测哪两个人会更早经历健康事件方面,其预测正确的频率。
"对于所有可能的个体对,模型会给出一个谁更有可能更早经历事件——比如心脏病发作——的排序。C指数为0.8意味着模型在80%的情况下,其预测与实际发生的情况是一致的,"Zou说。
SleepFM在预测帕金森病(C指数0.89)、痴呆症(0.85)、高血压性心脏病(0.84)、心脏病发作(0.81)、前列腺癌(0.89)、乳腺癌(0.87)和死亡(0.84)方面表现尤其出色。
"我们惊喜地发现,对于一个相当多样化的疾病集合,该模型能够做出有信息量的预测,"Zou说。
Zou还指出,准确性较低的模型,通常C指数在0.7左右,已经被用于医疗实践,例如帮助预测患者对某些癌症治疗反应的工具。
理解AI所看到的内容
研究人员目前正致力于提高SleepFM的预测能力,并更好地理解系统得出结论的方式。未来的版本可能会整合来自可穿戴设备的数据,以扩大生理信号的范围。
"它不会用英语向我们解释,"Zou说。"但我们已经开发了不同的解释技术,以弄清楚模型在做出特定疾病预测时正在关注什么。"
研究小组发现,虽然与心脏相关的信号在预测心血管疾病方面影响更大,与大脑相关的信号在精神健康预测中起着更大的作用,但最准确的结果来自于结合所有类型的数据。
"我们从对比不同信道中获得了最多的疾病预测信息,"Mignot说。不同步的身体组成部分——例如,大脑看起来处于睡眠状态但心脏看起来处于清醒状态——似乎预示着麻烦。
生物医学数据科学博士生Rahul Thapa和丹麦技术大学的博士生Magnus Ruud Kjaer是该研究的联合作一作。
来自丹麦技术大学、哥本哈根大学医院-Rigshospitalet、BioSerenity、哥本哈根大学和哈佛医学院的研究人员为这项工作做出了贡献。
这项研究获得了美国国立卫生研究院(资助号R01HL161253)、Knight-Hennessy Scholars和Chan-Zuckerberg Biohub的资助。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区