目 录CONTENT

文章目录

美图公司推出AI视觉大模型“Visit-Anything”,并公布了其在多场景下的应用实践

Administrator
2026-01-28 / 0 评论 / 0 点赞 / 1 阅读 / 0 字

📢 转载信息

原文链接:https://36kr.com/p/3657331148464259?f=rss

原文作者:赵小溪


在AI大模型持续迭代的背景下,美图公司正在加速其AI影像技术的产品化落地。5月22日,美图公司对外发布了其自研的视觉大模型Visit-Anything,并公布了Visit-Anything在设计、营销、电商等场景的应用实践,希望借此提升美图系产品的智能化水平。

据介绍,Visit-Anything是一个可控、通用、高精度的视觉大模型。它的核心能力在于对图像中任何物体的精准识别和交互理解,支持用户通过文字或画笔快速定位图像中的目标元素,进行精准的分割、编辑与生成。

美图公司AI研发负责人表示,Visit-Anything的发布,是美图在AI影像技术研发上的重要进展,也标志着美图正在从单点技术突破迈向多模态大模型的全面部署。

美图Visit-Anything模型:核心能力详解

Visit-Anything模型的设计目标是实现对图像“万物皆可选中,万物皆可编辑”的能力。它主要通过以下几点实现其强大的视觉理解和交互能力:

1. 精准的交互式分割

Visit-Anything能够处理多样化的输入指令,无论是文字描述(如“选择桌子上的那只猫”)还是视觉引导(如用画笔涂抹区域),模型都能快速、高精度地识别并分割出目标对象。这解决了传统图像编辑中选择物体不精确、耗时费力的问题。

2. 通用性与泛化能力

模型在海量多领域数据上进行训练,使其具备极强的泛化能力。它不仅能处理清晰的专业图像,也能应对复杂背景、光照不均、物体遮挡等多种场景下的图像。

3. 跨模态理解与生成

作为视觉大模型,Visit-Anything整合了图像理解内容生成能力。用户在选中物体后,可以直接利用文本指令进行替换、移除或风格化处理,实现了从“理解”到“创造”的无缝衔接。

美图公司表示,该模型在交互精准度、速度和鲁棒性方面均达到了行业领先水平。

Visit-Anything在不同场景的应用实践

美图公司正在加速将Visit-Anything集成到其核心产品矩阵中,尤其是在设计、营销和电商领域,旨在通过AI赋能内容生产效率。

1. 设计工具提效

在设计工具中,Visit-Anything极大地简化了复杂的图像处理流程。例如,设计师可以直接选中复杂背景中的主体人物或物体,一键抠图,并进行精细的细节调整或背景替换,将原本耗时的操作缩短到几秒钟。

美图Visit-Anything应用示例图一

2. 营销内容快速生成

在营销领域,创意素材的快速迭代至关重要。利用Visit-Anything,营销人员可以快速对广告图片中的元素进行风格迁移、对象重排或氛围调整,以适应不同的推广渠道和用户偏好,实现素材的A/B测试和快速优化。

3. 电商产品图处理自动化

电商对产品图的精修要求极高。Visit-Anything能够帮助电商卖家自动、精准地处理商品图片,例如:

  • 商品精修:快速去除背景,替换为专业场景图。
  • 多角度展示:通过对单一物体的高精度分割,辅助生成多角度或不同搭配的展示图。
  • 瑕疵修复:精准定位并修复产品细节上的小瑕疵。

美图Visit-Anything应用示例图二

战略布局:构建全链路AI影像生态

美图公司首席执行官吴欣鸿曾表示,美图将“AI驱动”作为未来发展的核心战略。Visit-Anything的发布,是美图在AI基础设施建设上的又一重大布局。

目前,美图的AI影像能力已经全面覆盖了“AIGC(AI生成内容)+ 生产力工具”的闭环。从底层的视觉大模型(如Visit-Anything),到中层的AI编辑、AI生成能力,再到上层的AI修图、AI设计等应用,形成了一个完整的AI影像生态链。

“我们希望通过Visit-Anything这样的基础模型,能够让更多的美图工具变得更聪明、更强大,最终实现让‘美’和‘创意’的生产力大大提升。” —— 美图公司内部人士

据悉,Visit-Anything模型及其衍生能力将逐步向美图旗下的多款产品(如美图秀秀、美图设计室等)进行深度融合与升级,为用户提供更具创造性的AI体验。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区