📢 转载信息
原文链接:https://www.sciencedaily.com/releases/2025/11/251112111023.htm
原文作者:Lehigh University
据研究组织报告,一项突破性的预测方法实现了惊人地接近现实测量的结果。

由Lehigh大学统计学家Taeho Kim领导的国际数学家团队,开发出一种新的方法来生成与现实世界结果更紧密匹配的预测。他们的方法旨在提高科学许多领域的预报能力,特别是在健康研究、生物学和社会科学领域。
研究人员将他们的技术称为“最大一致性线性预测器”(Maximum Agreement Linear Predictor,简称MALP)。其核心目标是提高预测值与观测值匹配的程度。MALP通过最大化一致性相关系数(Concordance Correlation Coefficient,简称CCC)来实现这一点。这种统计度量评估的是散点图中一对对数字落在哪条45度线上的程度,它同时反映了精度(点聚集的紧密程度)和准确性(它们与该线的接近程度)。Kim,数学助理教授,表示,传统方法,包括广泛使用的最小二乘法,通常试图减少平均误差。尽管在许多情况下它们很有效,但当主要目标是确保预测与实际值之间有强有力的一致性时,这些方法可能会失准。
"有时,我们不只是希望我们的预测接近目标——我们希望它们与真实值具有最高的一致性,"Kim解释说。"问题是,我们如何以科学上有意义的方式来定义两个对象的一致性?我们概念化此的一种方式是观察散点图中这些点与45度线的对齐程度,该散点图位于预测值和实际值之间。因此,如果这些点的散点图显示出与这条45度线的强烈对齐,那么我们可以说这两个值之间存在着良好的一致性。"
为什么一致性比简单相关性更重要
根据Kim的说法,当人们听到“相关性”一词时,他们首先想到的是皮尔逊相关系数,因为它在统计学教育的早期就被介绍,并且仍然是一个基本工具。皮尔逊的方法衡量两个变量之间线性关系的强度,但它没有具体检查这种关系是否与45度线对齐。例如,只要数据点紧密地排列成一条直线,皮尔逊方法就可以检测到倾斜角度为50度或75度的强相关性,Kim说。
"在我们的案例中,我们特别关注与45度线的对齐情况。为此,我们使用了不同的度量:Lin在1989年引入的一致性相关系数。该指标专门关注数据与45度线对齐的程度。我们开发的就是一个旨在最大化预测值与实际值之间一致性相关的预测器。"
使用眼部扫描和身体测量数据测试MALP
为了评估MALP的性能,研究团队使用模拟数据和真实测量数据(包括眼部扫描和身体脂肪评估)进行了测试。一项研究将MALP应用于眼科项目的数据,该项目比较了两种类型的光学相干断层扫描(OCT)设备:较旧的Stratus OCT和较新的Cirrus OCT。随着医疗中心转向Cirrus系统,医生需要一种可靠的方法来转换测量值,以便他们可以比较随时间变化的结果。研究人员使用了来自26只左眼和30只右眼的高质量图像,检查了MALP能多准确地从Cirrus OCT测量值中预测出Stratus OCT读数,并将其性能与最小二乘法进行了比较。MALP得出的预测与真实的Stratus值对齐得更紧密,而最小二乘法在减少平均误差方面略胜一筹,这突显了一致性与误差最小化之间的权衡。
该团队还研究了一组包含252名成年人的身体脂肪数据集,其中包括体重、腹围和其他身体测量数据。身体脂肪百分比的直接测量方法(如水下称重)虽然可靠但成本高昂,因此通常会采用更简便的测量方法作为替代。MALP被用来估计身体脂肪百分比,并与最小二乘法进行了评估。结果与眼部扫描研究相似:MALP提供的预测与真实值匹配得更紧密,而最小二乘法再次具有略低的平均误差。这种重复出现的模式强调了一致性与误差最小化之间持续存在的平衡。
为正确的任务选择正确的工具
Kim和他的同事们观察到,MALP通常能比标准技术更有效地匹配实际数据。即便如此,他们也指出,研究人员应根据自己的具体优先事项在MALP和更传统的方法之间进行选择。当减少总体误差是主要目标时,既有的方法仍然表现良好。当重点是使预测尽可能与实际结果保持一致性时,MALP通常是更强大的选择。
这项工作的潜在影响涉及许多科学领域。改进的预测工具可以造福医学、公共卫生、经济学和工程学。对于那些依赖预报的研究人员来说,MALP提供了一个有希望的替代方案,特别是当实现与现实世界结果的紧密一致性比仅仅缩小预测值与观测值之间的平均差距更重要时。
"我们需要进一步研究,"Kim说。"目前,我们的设定在线性预测器的范畴内。这个集合足够大,可以实际应用于各个领域,但在数学层面上仍然是受限的。因此,我们希望将其扩展到一般范畴,以便我们的目标是去除线性部分,使其成为最大一致性预测器。"
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区