美图公司推出AI视觉大模型“Visit-Anything”，并公布了其在多场景下的应用实践-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://36kr.com/p/3657331148464259?f=rss

原文作者：赵小溪

在AI大模型持续迭代的背景下，美图公司正在加速其AI影像技术的产品化落地。5月22日，美图公司对外发布了其自研的视觉大模型Visit-Anything，并公布了Visit-Anything在设计、营销、电商等场景的应用实践，希望借此提升美图系产品的智能化水平。

据介绍，Visit-Anything是一个可控、通用、高精度的视觉大模型。它的核心能力在于对图像中任何物体的精准识别和交互理解，支持用户通过文字或画笔快速定位图像中的目标元素，进行精准的分割、编辑与生成。

美图公司AI研发负责人表示，Visit-Anything的发布，是美图在AI影像技术研发上的重要进展，也标志着美图正在从单点技术突破迈向多模态大模型的全面部署。

美图Visit-Anything模型：核心能力详解

Visit-Anything模型的设计目标是实现对图像“万物皆可选中，万物皆可编辑”的能力。它主要通过以下几点实现其强大的视觉理解和交互能力：

Visit-Anything能够处理多样化的输入指令，无论是文字描述（如“选择桌子上的那只猫”）还是视觉引导（如用画笔涂抹区域），模型都能快速、高精度地识别并分割出目标对象。这解决了传统图像编辑中选择物体不精确、耗时费力的问题。

模型在海量多领域数据上进行训练，使其具备极强的泛化能力。它不仅能处理清晰的专业图像，也能应对复杂背景、光照不均、物体遮挡等多种场景下的图像。

作为视觉大模型，Visit-Anything整合了图像理解和内容生成能力。用户在选中物体后，可以直接利用文本指令进行替换、移除或风格化处理，实现了从“理解”到“创造”的无缝衔接。

美图公司表示，该模型在交互精准度、速度和鲁棒性方面均达到了行业领先水平。

美图公司正在加速将Visit-Anything集成到其核心产品矩阵中，尤其是在设计、营销和电商领域，旨在通过AI赋能内容生产效率。

在设计工具中，Visit-Anything极大地简化了复杂的图像处理流程。例如，设计师可以直接选中复杂背景中的主体人物或物体，一键抠图，并进行精细的细节调整或背景替换，将原本耗时的操作缩短到几秒钟。

美图Visit-Anything应用示例图一

在营销领域，创意素材的快速迭代至关重要。利用Visit-Anything，营销人员可以快速对广告图片中的元素进行风格迁移、对象重排或氛围调整，以适应不同的推广渠道和用户偏好，实现素材的A/B测试和快速优化。

电商对产品图的精修要求极高。Visit-Anything能够帮助电商卖家自动、精准地处理商品图片，例如：

美图Visit-Anything应用示例图二

美图公司首席执行官吴欣鸿曾表示，美图将“AI驱动”作为未来发展的核心战略。Visit-Anything的发布，是美图在AI基础设施建设上的又一重大布局。

目前，美图的AI影像能力已经全面覆盖了“AIGC（AI生成内容）+ 生产力工具”的闭环。从底层的视觉大模型（如Visit-Anything），到中层的AI编辑、AI生成能力，再到上层的AI修图、AI设计等应用，形成了一个完整的AI影像生态链。

“我们希望通过Visit-Anything这样的基础模型，能够让更多的美图工具变得更聪明、更强大，最终实现让‘美’和‘创意’的生产力大大提升。” —— 美图公司内部人士

据悉，Visit-Anything模型及其衍生能力将逐步向美图旗下的多款产品（如美图秀秀、美图设计室等）进行深度融合与升级，为用户提供更具创造性的AI体验。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。