📢 转载信息
原文链接:https://www.wired.com/story/google-nano-banana-pro-hands-on/
原文作者:Reece Rogers
在2025年,企业级AI的“垃圾”(Corporate AI slop)似乎无处不在。从网站横幅广告到户外广告牌,我被企业使用人工智能工具生成的图像包围着。就连街角的酒吧也会贴出欢乐时光传单,上面有着某些AI图形特有的朦胧、琥珀色的光芒。
周四,谷歌发布了Nano Banana Pro,这是该公司最新的图像生成模型。这次发布中的许多更新都针对企业应用,比如将Nano Banana Pro集成到Google Slides中用于商业演示,以及将新模型与Google Ads整合,服务全球广告商。
这个“Pro”版本是对今年早些时候发布的Nano Banana模型的迭代。Nano Banana因用户开始在社交媒体上发布个性化动作人偶和其他可制作表情包的创作而爆红。
Nano Banana Pro通过一系列新功能扩展了这个AI工具的功能,例如生成4K分辨率的图像。用户可以在谷歌的Gemini应用内免费试用,而付费的Google One订阅用户可以获得额外的生成次数。
这次发布中有一项特定的改进将是企业的最爱:文本渲染。根据我对生成带文本输出的初步测试,Nano Banana Pro改进了许多图像模型(包括谷歌以往的版本)中常见的文字扭曲和奇怪的拼写错误。
谷歌希望这个新模型生成的图像——包括文字——对于商业用途来说更加精美和可投入生产。谷歌DeepMind的图像和视频产品负责人Nicole Brichtova说:“即使有一个字母出错,那也是非常明显的。这就像看到一只长了六根手指的手;这是你首先注意到的东西。” 她表示,Nano Banana Pro能够更干净地生成文本的部分原因是切换到了一个更强大的底层模型——Gemini 3 Pro。

该工具如何从多张图像中创建合成图像的示例。
Courtesy of Google我生成的模拟传单和网页横幅广告仍然带有AI生成图形中常见的黄色调。尽管如此,Nano Banana Pro还是能根据单个提示,组合出相当详细的营销材料,其中包含多种字体的完整句子。你可以通过后续的提示要求修改图像,比如移除某个细节或调整整体风格。
Brichtova说,这种改进的文本渲染使得Nano Banana Pro中信息图表的创建效果显著提升。在我的一些初步测试中,事实确实如此。该工具生成的关于如何无伤炸火鸡的信息图表包含了合理的说明,并引用了美国消防局(一个联邦机构)的警告以及其他适当的安全预防措施。

文本渲染得到了改进。
Courtesy of GoogleBrichtova说:“该模型现在利用Gemini的世界知识和推理能力,不仅能生成精美的视觉效果,还能生成信息丰富的视觉效果。”她补充道:“你可以制作关于你最喜欢的动物的信息图表,或者制作可以放入工作演示文稿中的视觉材料。”白领们可以预期在工作场所看到AI视觉内容的频率将比现在更高,无论是演示幻灯片还是宣传材料。
在我的首日测试中,Nano Banana Pro仍在图像标注方面遇到困难。当被要求生成一张感恩节盛宴摆在桌上的图像,并要求标注图中所有物品时,AI的输出中出现了一个指向勺子的箭头,但标注却是“秋叶”(Autumn leaves)。餐盘靠近山核桃派(pecan pie)的地方被标注成了山核桃派。而桌子上一个空位被标记为“晚餐卷”(dinner rolls),尽管桌上根本没有出现任何面包。
请不要邀请我去参加你们的秋季盛宴,如果那里没有面包。拜托了。
Nano Banana Pro更新的另一个方面是生成其他语言的文本。“这是我第一次看到我们的模型能够渲染捷克语,包括变音符号和所有内容,”Brichtova说。企业可以要求将品牌视觉效果切换到其他语言以进行本地化。谷歌的模型介绍博客展示了该工具如何将一罐能量饮料上的文字从英语更改为韩语,同时保留了其他设计元素。

该模型可以调整照片中的光照和色彩。
Courtesy of Google由于该AI工具连接到Google Search,Nano Banana Pro可以从网上抓取细节并将其融入输出的图形中。不过,要获得最佳效果,你需要明确具体要求。
考虑到许多美国人正在进行假日旅行,我输入了提示:“创建一张图像,显示感恩节当天SFO(旧金山国际机场)的天气情况。”最初,输出让我感到困惑。那是一张逼真的机场内部照片,靠近一个有大窗户、可以欣赏到美景的登机口。两个穿着同款羽绒服的人正在四处走动。仔细一看,我注意到图像角落有一个小小的蓝色标志,上面显示了感恩节的日期和预测的温度。

Nano Banana Pro在从零开始制作信息图表方面要好得多。
Courtesy of Google在多次尝试重新措辞提示并获得类似结果后,直到我明确指出我想要的是一个“信息图表”而不是“图像”,Nano Banana Pro才吐出了一个卡通化的天气预报,其中的数据来源于Google Weather。
尽管仍有一些瑕疵,Nano Banana Pro很可能会持续流行。企业需要更高分辨率的输出,以及更低成本创建营销资产的方式。由企业为内部和外部目的生成的企业级AI垃圾时代正在蓬勃发展。不过,就个人而言,我不确定在AI生成的演示文稿中,即使文字生成正确,我能坐过多少次而不会睡着。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区