📢 转载信息
原文作者:Microsoft Research
AsgardBench:用于视觉基础交互规划的基准测试

在人工智能与机器人技术的前沿领域,如何让智能体更好地理解复杂的视觉环境并进行高效的交互规划一直是一个核心挑战。微软研究团队近期推出的 AsgardBench,正是为了解决这一问题而生的全新基准测试。
AsgardBench 旨在为视觉基础交互规划(Visually Grounded Interactive Planning)提供一个标准化的评估环境。通过模拟现实世界中复杂的交互场景,该基准能够深入考察AI系统在感知视觉信息、理解空间关系以及执行长序列规划任务时的实际表现。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区