📢 转载信息
原文链接:https://news.mit.edu/2025/vaxseer-ai-tool-to-improve-flu-vaccine-strain-selection-0828
原文作者:Rachel Gordon | MIT CSAIL
麻省理工学院研究人员开发AI工具,旨在优化流感疫苗毒株选择
VaxSeer利用机器学习预测病毒进化和抗原性,目标是使疫苗选择更加精确,减少对猜测的依赖。

图注:麻省理工学院开发的VaxSeer系统可以预测主要的流感毒株,并识别出保护性最强的候选疫苗。该工具使用经过数十年病毒序列和实验室测试结果训练的深度学习模型,来模拟流感病毒可能如何进化以及疫苗将如何响应。图示:资深作者Regina Barzilay(左)和第一作者Wenxian Shi。
图片来源:Alex Gagne
每年,全球卫生专家都面临着一个高风险的决定:下一季度的流感疫苗中应该包含哪些流感毒株?这个选择必须提前数月做出,往往是在流感季节开始之前,并且常常像一场与时间的赛跑。如果选定的毒株与实际流行的毒株匹配,疫苗可能会非常有效。但如果预测失误,保护力可能会显著下降,导致(本可预防的)疾病和医疗系统的压力。
在新冠疫情期间,科学家们对这一挑战有了更深的体会。回想一下,每当疫苗推出时,新的变种病毒就会出现。流感病毒就像一个类似的、顽皮的“表亲”,不断地、不可预测地变异。这使得保持领先地位变得困难,从而更难设计出持续有效的疫苗。
为了减少这种不确定性,麻省理工学院计算机科学与人工智能实验室(CSAIL)以及麻拉蒂夫·贾米尔健康机器学习诊所的科学家们致力于使疫苗选择更加准确,减少对猜测的依赖。他们创建了一个名为VaxSeer的人工智能系统,旨在提前数月预测主要的流感毒株并识别出保护性最强的候选疫苗。该工具利用经过数十年病毒序列和实验室测试结果训练的深度学习模型,来模拟流感病毒可能如何进化以及疫苗将如何响应。
传统的进化模型通常独立分析单个氨基酸突变的影响。麻省理工学院电气工程与计算机科学系博士生、CSAIL研究员、该项工作的第一作者Wenxian Shi解释说:“VaxSeer采用了一个大型蛋白质语言模型,来学习显性性与突变的组合效应之间的关系。”他补充道,“与那些假设病毒变异分布是静态的现有蛋白质语言模型不同,我们模拟了动态的显性性转移,使其更适合像流感这样快速进化的病毒。”
这项研究的开放获取报告今天发表在《自然医学》杂志上。
流感的未来
VaxSeer有两个核心预测引擎:一个引擎估计每种病毒株传播的可能性(显性性 Dominance),另一个引擎估计疫苗中和该毒株的有效性(抗原性 Antigenicity)。它们共同产生一个预测覆盖率得分:一个衡量特定疫苗对抗未来病毒的潜在表现的前瞻性指标。
该得分的范围可以从负无穷到0。得分越接近0,疫苗毒株与循环病毒的抗原匹配度就越好。(您可以将其想象为某种“距离”的负值。)
在一项为期10年的回顾性研究中,研究人员评估了VaxSeer针对世界卫生组织(WHO)对两种主要流感亚型(A/H3N2和A/H1N1)所做的建议。对于A/H3N2,根据回顾性实证覆盖率得分(通过过去季节的观察到的显性性和实验性的HI测试结果计算出的疫苗有效性的替代指标),VaxSeer的选择在10个季节中优于WHO的选择达9次。(研究团队使用此方法来评估疫苗选择,因为只有实际接种给人群的疫苗才会有有效性数据。)
对于A/H1N1,它在10个季节中有6个季节优于或持平于WHO的建议。在一个值得注意的案例中,对于2016年流感季节,VaxSeer确定了一个直到第二年WHO才选择的毒株。该模型的预测与CDC、加拿大哨点医生监测网络和欧洲I-MOVE项目报告的真实世界疫苗有效性估计值也显示出很强的相关性。VaxSeer的预测覆盖率得分与公共卫生数据中预防接种所避免的流感相关疾病和医疗就诊情况密切吻合。
那么,VaxSeer究竟是如何理解所有这些数据的呢?直观地说,该模型首先使用蛋白质语言模型估计病毒株随时间传播的速度,然后通过考虑不同毒株之间的竞争来确定其显性性。
一旦模型计算出其见解,这些信息就会被输入到一个基于“常微分方程”的数学框架中,以模拟病毒随时间的传播。对于抗原性,系统会估计特定的疫苗毒株在一种常见的实验室测试——血凝抑制试验(hemagglutination inhibition assay)中表现如何。该试验测量了抗体抑制病毒与人体红细胞结合的有效性,这是抗原匹配性/抗原性的一个广泛使用的替代指标。
跑赢进化
Shi说:“通过模拟病毒的进化以及疫苗与它们的相互作用,像VaxSeer这样的AI工具可以帮助卫生官员做出更好、更快的决策——并在感染和免疫的竞赛中保持领先地位。”
VaxSeer目前只关注流感病毒的HA(血凝素)蛋白,这是流感的主要抗原。未来的版本可能会加入其他蛋白质,如NA(神经氨酸酶),以及免疫史、制造限制或剂量水平等因素。将该系统应用于其他病毒也需要追踪病毒进化和免疫反应的大型、高质量数据集——而这些数据并不总是公开可用的。不过,该团队目前正在研究构建基于病毒家族关系的方法,以在低数据情况下预测病毒进化。
麻省理工学院工程学教授、AI与健康领域杰出教授、Jameel诊所AI负责人和CSAIL首席研究员Regina Barzilay说:“考虑到病毒进化的速度,当前的治疗方法开发往往滞后。VaxSeer是我们试图追赶的尝试。”
加拿大安大略省麦克马斯特大学生物化学与生物医学科学系的助理教授Jon Stokes评论道:“这篇论文很出色,但更让我兴奋的是该团队在低数据环境中预测病毒进化方面正在进行的工作。”他表示:“其意义远远超出了流感。想象一下,能够预见抗生素耐药菌或耐药癌是如何进化的,它们都能迅速适应。这种预测性建模开启了一种关于疾病如何变化的新颖思维方式,为我们在逃逸成为主要问题之前,提前一步设计临床干预措施提供了机会。”
Shi和Barzilay与MIT CSAIL博士后Jeremy Wohlwend('16, MEng '17, PhD '25)和近期CSAIL成员Menghua Wu('19, MEng '20, PhD '25)共同撰写了这篇论文。他们的工作得到了美国国防威胁降低局和麻省理工学院Jameel诊所的部分资助。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区