目 录CONTENT

文章目录

90%的科学成果正在流失,这款新AI找到了它们

Administrator
2025-10-26 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.sciencedaily.com/releases/2025/10/251013040314.htm

原文作者:Frontiers


大多数科学数据都未能充分发挥其推动新发现的潜力。


在产生的每100个数据集中,大约有80个仍然保留在实验室内部,20个被分享但很少被重复使用,少于2个符合FAIR标准,通常只有一个数据集最终能带来新的发现。


其后果是巨大的:癌症治疗进展缓慢、气候模型缺乏足够证据,以及研究无法被复制。


为了改变这一现状,开放科学出版商Frontiers推出了被誉为全球首个综合性、由AI驱动的研究数据服务——Frontiers FAIR²数据管理系统。它旨在通过将所有关键步骤——数据整理、合规性检查、AI就绪格式化、同行评审、交互式门户、认证和永久托管——整合到一个无缝流程中,使数据既可重用又能得到妥善的归属(credited)。其目标是确保今天的科研投入能够转化为卫生、可持续性和技术方面更快的进步。


FAIR²建立在FAIR原则(可查找、可访问、可互操作和可重用)之上,并扩展为一个开放框架,保证每个数据集都对人类和机器都具有AI兼容合乎伦理的重用性。FAIR²数据管理系统是该模型的第一个实际应用,它恰逢研究产出快速增长和人工智能重塑发现方式的时刻。它将高层原则转化为具有可衡量影响力的、真实且可扩展的基础设施。


Frontiers的联合创始人兼首席执行官Kamila Markram博士解释道:


“百分之九十的科学成果都消失在了虚空之中。有了Frontiers FAIR²数据管理系统,任何数据集和任何发现都不必再丢失——每项贡献现在都可以助推进步,获得应有的认可,并释放科学的潜力。”

AI是核心

过去需要数月手动完成的工作——从组织和验证数据集到生成元数据和可发布成果——现在由AI数据管家(AI Data Steward)在几分钟内完成,该系统由Senscience(Frontiers旗下专注于FAIR²的风险投资部门)提供支持。


提交数据的研究人员将获得四项集成化的成果:一个认证的数据包、一篇同行评审且可引用的数据文章、一个包含可视化和AI聊天功能的交互式数据门户,以及一个FAIR²证书。每项成果都包含质量控制和清晰的摘要,使数据更容易被普通用户理解,并增强了跨研究学科的兼容性。


这些成果共同确保每个数据集都得到保存、验证、可引用和可重用,有助于加速发现,同时确保研究人员获得应有的认可。Frontiers FAIR²还增强了可见性和可访问性,支持科学家、政策制定者、从业者、社区甚至AI系统的负责任重用,使社会能够从其对科学的投资中提取更大的价值。

旗舰试点数据集

  • SARS-CoV-2 变异株特性 -- 涵盖3800种刺突蛋白变异株,该数据集将AlphaFold2和ESMFold的结构预测与ACE2结合和表达数据联系起来。它为大流行防范提供了一个强大的资源,有助于更深入地理解变异株的行为和适应性。

  • 临床前脑损伤MRI -- 一个来自四个研究中心的343份弥散性MRI扫描的统一数据集,跨协议标准化并对齐以确保可比性。它支持可重复的生物标志物发现、强大的跨站点分析,以及临床前创伤性脑损伤研究的进步。

  • 环境压力指标 (1990-2050) -- 该数据集结合了60多年来跨越43个国家的观测数据和模型预测,追踪了排放、废物、人口和GDP。它为可持续性基准测试和循证气候政策规划奠定了基础。

  • 印度-太平洋环礁生物多样性 -- 涵盖五个地区共280个环礁,该数据集整合了生物多样性记录、珊瑚礁栖息地、气候指标和人类使用历史。它为生态建模、保护优先排序以及对脆弱岛屿生态系统的跨区域研究提供了前所未有的基础。

测试这些试点项目的研究人员指出,Frontiers FAIR²不仅保存和共享数据,还通过质量检查、为非专业人士提供的清晰摘要,以及跨学科组合数据集的可靠性来建立对数据重用的信心,同时确保科学家获得认可。


所有试点数据集都符合FAIR²开放规范,使它们得到负责任的整理、可重用,并可信赖地用于长期的人工和机器使用,以便今天的数据能够加速解决社会最紧迫挑战的明天方案。

认可与重用

每一次重用都会使原始数据集的价值成倍增加,确保没有任何发现被浪费,每项贡献都能激发下一次突破,研究人员也能因其工作获得认可。


Senscience(FAIR²数据管理背后的Frontiers AI风险投资部门)的联合创始人兼首席执行官Sean Hill博士指出:


“科学投入数十亿资金生成数据,但其中大部分都丢失了——而研究人员很少因此受到赞扬。有了Frontiers FAIR²,每个数据集都会被引用,每位科学家都会受到认可——终于奖励了数据创建这项基础工作。这就是治愈方法、气候解决方案和新技术能够更快地惠及社会的方式——这就是我们释放科学潜力的方式。”

研究人员的评价

Ángel Borja博士,AZTI,海洋研究,巴斯克研究与技术联盟(BRTA)首席研究员:


“我高度[推荐使用]这类数据整理和文章发表方式,因为你可以非常快速地生成信息,而且它对任何最终用户都有用处。”

Erik Schultes,莱顿学术药物研究中心(LACDR)高级研究员;GO FAIR基金会FAIR实施负责人:


“Frontiers FAIR²完美地捕捉了项目的科学方面。”

Femke Heddema,PharmAccess研究员兼健康数据系统创新经理:


“Frontiers FAIR²使研究人员和数字健康实施者更顺畅地执行FAIR原则,证明像MomCare这样的数据集可重用化不必很复杂。通过实现透明、可访问和可操作的数据,Frontiers FAIR²为健康研究开启了新机遇的大门。”

Neil Harris博士,加州大学洛杉矶分校(UCLA)脑损伤研究中心神经外科学系驻校教授:


“实施[Frontiers] FAIR²可以对数据的缺失和质量进行客观检查,这在许多层面上都很有用。这些类型的公正评估和数据摘要可以帮助非领域专家理解,从而最终增强数据共享。随着该领域发展到在更多不同的子学科中使用大数据,这些数据检查和摘要将对于我们能否在当前分析中很好地掌握如何使用和组合已获取的大量数据至关重要。”

Maryann Martone,开放数据共享(Open Data Commons)主编:


“[Frontiers] FAIR² 是实现数据FAIR化最简单、最有效的方法之一。每位首席研究员都希望他们的数据在实验室、与合作者以及整个科学界都是可查找、可访问、可比较和可重用的——真正的瓶颈一直以来都是所需的时间和精力。[Frontiers] FAIR² 大大降低了这一门槛,使大多数实验室都能接触到真正的数据。”

Vincent Woon Kok Sin博士,香港科技大学(HKUST)碳中和与气候变化研究组助理教授:


“[Frontiers] FAIR² 使我们的全球废物数据集更加可见和可访问,帮助那些经常面临稀缺和碎片化数据的全球研究人员。我希望这将促进合作,加速对可持续废物管理的洞察。”

Sebastian Steibl博士,自然生物多样性中心和奥克兰大学博士后研究员:


“真正的数据可访问性超越了仅仅将数据表上传到存储库。它意味着无需多年的培训,数据就可以易于查看、探索和理解。 [Frontiers] FAIR² 平台,通过人工智能聊天机器人和交互式视觉数据探索与摘要工具,使我们的生物多样性和环境数据不仅对学者,而且对从业者、政策制定者和当地社区倡议也具有广泛的可访问性和可用性。”



🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区