📢 转载信息
原文链接:https://techcrunch.com/2025/11/06/laude-institute-announces-first-batch-of-slingshots-ai-grants/
原文作者:Russell Brandom

摘要:
在周四,Laude研究所宣布了其首批Slingshots赠款,旨在“推进人工智能的科学与实践”。
Slingshots计划旨在成为研究人员的加速器,提供在大多数学术环境中无法获得的资源,无论是资金、算力,还是产品和工程支持。作为回报,受资助者承诺将产生某种最终工作产品,如初创公司、开源代码库或其他类型的成果。
首批入选的共有15个项目,特别关注人工智能评估这一难题。其中一些项目对TechCrunch的读者来说可能并不陌生,包括命令行编码基准测试 Terminal Bench以及长期进行的ARC-AGI项目的最新版本。
其他项目则对一个长期存在的评估问题采取了新的方法。由加州理工学院和德克萨斯大学奥斯汀分校的研究人员构建的Formula Code,旨在评估AI智能体优化现有代码的能力;而总部位于哥伦比亚大学的BizBench则为“白领AI智能体”提出了一个全面的基准测试。其他赠款项目则探索了强化学习的新结构或模型压缩技术。
SWE-Bench联合创始人John Boda Yang也是该团队的一员,他领导着新的CodeClash项目。CodeClash的灵感来源于SWE-Bench的成功,它将通过一个动态的竞争框架来评估代码,Yang希望该框架能够...
“我确实认为人们继续在核心第三方基准上进行评估会推动进步,”Yang告诉TechCrunch。“我有点担心未来基准测试会变得只针对特定公司。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

评论区