首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
2598
篇文章
累计创建
886
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
多图像推理
相关的文章
2025-11-21
视觉干草堆:评估大型多模态模型在处理长上下文视觉信息方面的能力
人类擅长处理海量视觉信息,这对实现通用人工智能(AGI)至关重要。本文介绍了“视觉干草堆”(Visual Haystacks, VHs)基准,这是一个首个“视觉中心”的“针在干草堆中”(NIAH)测试集,旨在严格评估大型多模态模型(LMMs)处理长上下文视觉信息的能力。研究揭示了当前LMMs在视觉干扰、多图推理和信息位置敏感性方面的三大核心缺陷,并提出了创新的RAG解决方案MIRAGE以提升性能。
2025-11-21
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-11-10
视觉干草堆(Visual Haystacks):针对图像集合的更难问题的回答基准
本文介绍了“视觉干草堆”(Visual Haystacks, VHs)基准,这是首个“以视觉为中心”的“大海捞针”(NIAH)测试,旨在严格评估大型多模态模型(LMMs)处理长上下文视觉信息的能力。研究发现当前LMMs在视觉干扰、多图像推理和信息位置敏感性方面存在显著缺陷。为解决这些问题,作者提出了MIRAGE,一个基于检索增强生成的(RAG)框架,并在VHs基准上取得了最先进的性能。
2025-11-10
0
0
0
AI新闻/评测
AI基础/开发
2025-10-21
xT:用于大型图像中更大上下文的嵌套分词
计算机视觉领域在处理超大尺寸图像时面临巨大挑战,现有方法(如下采样或裁剪)会导致信息和上下文的严重丢失。伯克利BAIR的研究团队推出了$x$T框架,旨在无需妥协地端到端建模大型图像。$x$T通过嵌套分词,结合区域编码器和上下文编码器,实现在当代GPU上高效聚合全局上下文与局部细节,有望解决高分辨率图像处理的瓶颈。
2025-10-21
1
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-21
视觉草垛(Visual Haystacks):评估大型多模态模型处理长上下文视觉信息的新基准
人类擅长处理大量视觉信息,这对实现通用人工智能至关重要。本文介绍了“视觉草垛”(Visual Haystacks, VHs)基准,这是一个“视觉中心”的“大海捞针”(NIAH)基准,旨在严格评估大型多模态模型(LMM)处理长上下文视觉信息的能力。VHs揭示了当前模型在视觉干扰、跨多图推理和位置敏感性方面的三大主要缺陷,并提出了基于RAG的解决方案MIRAGE。
2025-10-21
1
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-13
面向多图像推理,我们准备好了吗?推出视觉干草堆(VHs)基准测试!
📢 转载信息 原文链接:http://bair.berkeley.edu/blog/2024/07/20/visual-haystacks/ 原文作者:Tsung-Han (Patrick) Wu, Giscard Biamby, Jerome Quenum, Ritwik Gupta, Jose
2025-10-13
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用