📢 转载信息
原文链接:https://www.sciencedaily.com/releases/2025/10/251013040314.htm
原文作者:Frontiers
大多数科学数据未能发挥其推动新发现的全部潜力。
在产生的每100个数据集中,大约有80个仍保留在实验室内部,20个被分享但很少被重复使用,不到2个符合FAIR标准,通常只有一个能带来新的发现。
其后果是重大的:癌症治疗进展缓慢、气候模型缺乏足够证据,以及研究无法被复制。
为了改变这一现状,开放科学出版商Frontiers推出了Frontiers FAIR² Data Management,这被描述为世界上第一个全面、由人工智能驱动的研究数据服务。它旨在通过将所有基本步骤——数据整理、合规性检查、AI就绪格式化、同行评审、交互式门户、认证和永久托管——整合到一个无缝流程中,使数据既可重用又得到适当的致谢。其目标是确保今天的研究投资能够更快地转化为健康、可持续性和技术的进步。
FAIR²建立在FAIR原则(可查找、可访问、可互操作和可重用)之上,并扩展为一个开放框架,保证每一个数据集都是AI兼容的,并且可供人类和机器合乎伦理地重用。FAIR²数据管理系统是该模型的第一个实际实施,它出现正值研究产出快速增长和人工智能正在重塑发现过程之时。它将高层原则转化为具有可衡量影响的真实、可扩展的基础设施。
Frontiers的联合创始人兼首席执行官Kamila Markram博士解释说:
"百分之九十的科学成果都消失在虚空中。有了Frontiers FAIR²数据管理,任何数据集和任何发现都不必再丢失——每项贡献现在都可以为进步提供燃料,获得应有的认可,并释放科学的潜力。"
AI 处于核心地位
过去需要数月手动工作的工作——从组织和验证数据集到生成元数据和可发布的结果——现在由Senscience(FAIR²背后的Frontiers风险投资公司)提供支持的AI数据管家在几分钟内即可完成。
提交数据的研究人员将获得四项集成输出:一个经认证的数据包(Certified Data Package)、一篇经过同行评审且可引用的数据文章(Data Article)、一个具有可视化和AI聊天的交互式数据门户(Interactive Data Portal),以及一个FAIR²证书(FAIR² Certificate)。每个要素都包含质量控制和清晰的摘要,使普通用户更容易理解数据,并增强了跨研究学科的兼容性。
这些输出共同确保每个数据集都得到保存、验证、可引用和可重用,有助于加速发现,同时给予研究人员应有的认可。Frontiers FAIR²还增强了可见性和可访问性,支持科学家、政策制定者、从业者、社区甚至AI系统负责任地重复使用数据,使社会能够从其科学投资中提取更大的价值。
旗舰试点数据集
-
SARS-CoV-2 变体特性 -- 涵盖3800个刺突蛋白变体,该数据集将AlphaFold2和ESMFold的结构预测与ACE2结合和表达数据联系起来。它为大流行防范提供了一个强大的资源,有助于更深入地了解变体的行为和适应性。
-
临床前脑损伤 MRI -- 一个来自四个研究中心的343次扩散MRI扫描的协调数据集,跨协议标准化并对齐以进行比较。它支持可复制的生物标志物发现、稳健的跨站点分析以及临床前创伤性脑损伤研究的进展。
-
环境压力指标 (1990-2050) -- 该数据集结合了六十年间43个国家的观测数据和模型预测,跟踪排放、废物、人口和GDP。它为可持续性基准测试和循证气候政策规划提供了基础。
-
印度-太平洋环礁生物多样性 -- 涵盖五个区域的280个环礁,该数据集整合了生物多样性记录、珊瑚礁栖息地、气候指标和人类使用历史。它为生态系统建模、保护优先排序以及对脆弱岛屿生态系统的跨区域研究提供了前所未有的基础。
测试这些试点项目的研究人员指出,Frontiers FAIR²不仅保存和共享数据,还通过质量检查、为非专业人士提供的清晰摘要,以及跨学科组合数据集的可靠性,建立了对其重用的信心——所有这些都同时确保了科学家获得认可。
所有试点数据集都符合FAIR²开放规范,使其得到负责任的整理、可重用,并可信赖地用于长期的人工和机器使用,以便今天的数据能够加速解决社会最紧迫挑战的未来解决方案。
认可与重用
每一次重用都会使原始数据集的价值成倍增长,确保没有发现被浪费,每一项贡献都能激发下一次突破,研究人员也能因其工作获得认可。
FAIR²数据管理的共同创建者兼Senscience(Frontiers的AI风险投资公司)首席执行官Sean Hill博士指出:
"科学投资数十亿美元生成数据,但其中大部分都丢失了——而研究人员很少得到认可。有了Frontiers FAIR²,每个数据集都会被引用,每位科学家都会得到认可——终于奖励了数据创建这项基本工作。这就是治愈、气候解决方案和新技术能够更快地惠及社会的方式——这就是我们释放科学潜力的方式。"
研究人员的评价
Ángel Borja博士,AZTI海洋研究所(巴斯克研究与技术联盟,BRTA)首席研究员:
"我高度[推荐使用]这种数据整理和文章发表方式,因为你可以非常快速地生成信息,而且其格式对任何最终用户都很有用。"
Erik Schultes,莱顿药物研究学术中心(LACDR)高级研究员;GO FAIR基金会FAIR实施负责人:
"Frontiers FAIR²完美地捕捉了项目的科学方面。"
Femke Heddema,PharmAccess研究员兼健康数据系统创新经理:
"Frontiers FAIR²使FAIR原则的执行对研究人员和数字健康实施者来说更加顺畅,证明像MomCare这样的数据集的可重用化并不复杂。通过实现透明、可访问和可操作的数据,Frontiers FAIR²为健康研究开启了新的机遇之门。"
Neil Harris博士,加州大学洛杉矶分校(UCLA)神经外科系、脑损伤研究中心驻校教授:
"[Frontiers] FAIR²的实施可以对数据的缺失和质量提供客观检查,这在许多层面上都很有用。这些类型的公正评估和数据摘要可以帮助非领域专家理解,从而最终增强数据共享。随着该领域发展到在更多分散的子学科中使用大数据,这些数据检查和摘要对于维持我们对如何在当前分析中使用和组合现有海量数据的良好掌握至关重要。"
Maryann Martone,开放数据委员会主编:
"[Frontiers] FAIR²是实现数据FAIR化最简单、最有效的方法之一。每位首席研究员都希望他们的数据在实验室、与合作者以及整个科学界都是可查找、可访问、可比较和可重用的——真正的瓶颈一直以来都是所需的时间和精力。[Frontiers] FAIR²极大地降低了这一门槛,使真正的数据触手可及。
Vincent Woon Kok Sin博士,香港科技大学(HKUST)碳中和与气候变化中心、社会枢纽助理教授:
"[Frontiers] FAIR²使我们的全球废物数据集更具可见性和可访问性,帮助了那些经常因数据稀缺和分散而苦苦挣扎的全球研究人员。我希望这将促进协作,并加速对可持续废物管理的见解。"
Sebastian Steibl博士,自然生物多样性中心和奥克兰大学博士后研究员:
"真正的数据可访问性不仅仅是将数据表上传到存储库。这意味着数据易于查看、探索和理解,而无需经过多年的培训。[Frontiers] FAIR²平台,凭借其人工智能聊天机器人和交互式视觉数据探索与摘要工具,使我们的生物多样性和环境数据不仅对学者,而且对从业人员、政策制定者和地方社区倡议也具有广泛的可访问性和可用性。"
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区