📢 转载信息
原文链接:https://www.sciencedaily.com/releases/2026/01/260109023114.htm
原文作者:Stanford Medicine
夜间辗转反侧通常会导致第二天的疲劳,但它也可能预示着在更晚时候才会出现的健康问题。斯坦福大学医学中心及其合作者的科学家们开发出一种人工智能系统,该系统可以检查一个晚上的睡眠身体信号,并估计一个人未来患上100多种不同疾病的风险。
该系统名为 SleepFM,是利用来自65,000名受试者近60万小时的睡眠记录进行训练的。这些记录来自多导睡眠图(polysomnography),这是一种深入的睡眠测试,使用多个传感器在睡眠期间跟踪脑电活动、心脏功能、呼吸模式、眼球运动、腿部运动和其他生理信号。
睡眠研究蕴含着尚未开发的健康数据
多导睡眠图被认为是评估睡眠的“黄金标准”,通常在实验室环境中进行一夜测试。虽然它被广泛用于诊断睡眠障碍,但研究人员意识到它还捕获了大量极少被充分分析的生理信息。
新研究的共同资深作者、斯坦福睡眠医学系的Craig Reynolds教授Emmanual Mignot医学博士说:“当我们研究睡眠时,我们会记录下惊人的信号数量。这是一种我们研究受试者八小时的通用生理学,而受试者完全处于受控状态。它包含的海量数据非常丰富。”该研究将于1月6日发表在《自然医学》(Nature Medicine)杂志上。
在常规临床实践中,只有其中一小部分信息被检查。人工智能的最新进展现在允许研究人员更彻底地分析这些庞大而复杂的数据集。据团队介绍,这项工作首次在大规模上将人工智能应用于睡眠数据。
该研究的另一位资深作者、生物医学数据科学副教授James Zou博士说:“从人工智能的角度来看,睡眠研究相对不足。在病理学或心脏病学方面有许多人工智能工作,但尽管睡眠是生活中如此重要的一部分,却很少有工作关注睡眠。”
教AI学习睡眠的模式
为了从数据中发掘见解,研究人员构建了一个基础模型(foundation model),这是一种旨在从大型数据集中学习广泛模式,然后将这些知识应用于多项任务的人工智能类型。像ChatGPT这样的大型语言模型使用类似的方法,尽管它们是基于生物信号而非文本进行训练的。
SleepFM 在从睡眠诊所评估的患者那里收集的585,000小时多导睡眠图数据上进行了训练。每个睡眠记录被分成五秒的片段,这在训练基于语言的人工智能系统中,其作用类似于“词汇”。
Zou说:“SleepFM 基本上是在学习睡眠的语言。”
该模型整合了来自脑信号、心率、肌肉活动、脉搏测量和呼吸期间气流等多种信息流,并学习这些信号如何相互作用。为了帮助系统理解这些关系,研究人员开发了一种称为“留一法对比学习”(leave-one-out contrastive learning)的训练方法。这种方法一次移除一种信号类型,并要求模型使用剩余的数据来重建它。
Zou说:“在这项工作中我们取得的技术进步之一是弄清楚如何协调所有这些不同的数据模态,使它们能够汇集在一起学习同一种语言。”
从睡眠预测未来疾病
训练完成后,研究人员针对特定任务调整了该模型。他们首先在标准睡眠评估方面进行了测试,例如识别睡眠阶段和评估睡眠呼吸暂停的严重程度。在这些测试中,SleepFM 的表现与目前使用的领先模型相当或超越了它们。
然后,团队追求一个更宏大的目标:确定睡眠数据是否可以预测未来的疾病。为此,他们将多导睡眠图记录与同一受试者的长期健康结果联系起来。之所以能够做到这一点,是因为研究人员能够从一个睡眠诊所获取到数十年的医疗记录。
斯坦福睡眠医学中心由已故的William Dement医学博士于1970年创立,他被公认为睡眠医学之父。用于训练 SleepFM 的最大群体包括大约35,000名年龄在2岁到96岁之间的患者。他们的睡眠研究是在1999年至2024年间在该诊所记录的,并与电子健康记录配对,其中一些患者被追踪了长达25年。
Mignot(曾在2010年至2019年期间担任睡眠中心主任)说,该诊所的多导睡眠图记录甚至可以追溯得更早,但仅以纸质形式存在。
利用这个组合数据集,SleepFM 审查了1000多个疾病类别,并确定了130种疾病仅凭睡眠数据就能以合理的准确性进行预测。预测效果最好的结果出现在癌症、妊娠并发症、循环系统疾病和精神健康障碍方面,预测评分的C指数(C-index)均高于0.8。
如何衡量预测准确性
C指数,即一致性指数(concordance index),衡量模型在按风险对人群进行排序方面的表现。它反映了模型在预测哪两个人会先发生健康事件方面,正确率有多高。
Zou解释说:“对于所有可能的个体对,该模型会给出一个谁更有可能更早发生事件(例如心脏病发作)的排序。C指数为0.8意味着模型预测正确的次数占所有情况的80%。”
SleepFM 在预测帕金森病(C指数0.89)、痴呆症(0.85)、高血压性心脏病(0.84)、心脏病发作(0.81)、前列腺癌(0.89)、乳腺癌(0.87)和死亡(0.84)方面表现尤为出色。
Zou表示:“我们很高兴地发现,对于相当多样化的疾病,该模型能够做出有信息量的预测。”
Zou还指出,准确性较低的模型(通常C指数在0.7左右)已经在医疗实践中使用,例如帮助预测患者对某些癌症治疗反应的工具。
理解AI看到了什么
研究人员目前正致力于提高 SleepFM 的预测能力,并更好地理解系统得出结论的方式。未来的版本可能会整合可穿戴设备的数据,以扩大生理信号的范围。
Zou说:“它不会用英语向我们解释(它是如何做到的)。但我们开发了不同的解释技术来弄清楚模型在做出特定疾病预测时正在关注什么。”
研究团队发现,虽然与心脏相关的信号在预测心血管疾病方面影响更大,与大脑相关的信号在精神健康预测中起着更大的作用,但最准确的结果来自于结合所有类型的数据。
Mignot说:“我们在预测疾病方面获得最多信息是通过对比不同的通道得出的。”那些不同步的身体组成部分——例如,大脑看起来处于睡眠状态但心脏看起来处于清醒状态——似乎预示着麻烦。
生物医学数据科学博士生Rahul Thapa和丹麦技术大学的博士生Magnus Ruud Kjaer是该研究的共同主要作者。
来自丹麦技术大学、哥本哈根大学医院-Rigshospitalet、BioSerenity、哥本哈根大学和哈佛医学院的研究人员也为这项工作做出了贡献。
这项研究获得了美国国立卫生研究院(资助号R01HL161253)、Knight-Hennessy学者项目和Chan-Zuckerberg Biohub的资助。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区