📢 转载信息
原文作者:Ivan Mehta
谷歌今日发布了其快速且经济的 Gemini 3 Flash 模型,该模型基于上个月发布的 Gemini 3,旨在抢占OpenAI的风头。该公司还宣布将此模型设为 Gemini 应用和搜索中AI模式的默认模型。
这款新的Flash模型是在谷歌宣布 Gemini 2.5 Flash 模型 六个月后推出的,带来了显著的改进。在基准测试中,Gemini 3 Flash 模型比其前身有显著的性能提升,并在某些衡量标准上与 Gemini 3 Pro 和 GPT 5.2 等前沿模型相媲美。
例如,在旨在测试跨领域专业知识的“Humanity’s Last Exam”基准测试中,该模型在不使用工具的情况下得分为 33.7%。相比之下,Gemini 3 Pro 得分为 37.5%,Gemini 2.5 Flash 得分为 11%,新发布的 GPT-5.2 得分为 34.5%。
在多模态和推理基准测试 MMMU-Pro 中,新模型以 81.2% 的得分超越了所有竞争对手。
消费者推广
谷歌正在全球范围内将 Gemini 3 Flash 设为 Gemini 应用的默认模型,取代了 Gemini 2.5 Flash。用户仍然可以从模型选择器中选择 Pro 模型来处理数学和编程问题。
该公司表示,新模型擅长识别多模态内容并据此给出答案。例如,您可以上传您的匹克球短视频并寻求技巧;您可以尝试绘制草图,让模型猜测您在画什么;或者您可以上传音频录音以获得分析或生成测验。
该公司还表示,该模型能更好地理解用户查询的意图,并能生成更多包含图像和表格等元素的视觉化答案。
您还可以使用新模型通过提示在 Gemini 应用中创建应用原型。
Gemini 3 Pro 现在在美国对所有人开放,并且更多美国用户可以在搜索中使用 Nano Banana Pro 图像模型。
企业和开发者可用性
谷歌指出,JetBrains、Figma、Cursor、Harvey 和 Latitude 等公司已经在使用 Gemini 3 Flash 模型,该模型可通过 Vertex AI 和 Gemini Enterprise 使用。
对于开发者而言,该公司正通过 API 和上个月发布的谷歌新编程工具 Antigravity 提供该模型的预览版。
该公司表示,Gemini 3 Pro 在经过验证的 SWE-bench 编程基准测试中得分为 78%,仅次于 GPT-5.2。它补充说,该模型非常适合视频分析、数据提取和视觉问答,并且由于其速度快,非常适合快速和可重复的工作流程。
模型定价为每 100 万输入令牌 0.50 美元,每 100 万输出令牌 3.00 美元。这比 Gemini Flash 2.5 的每 100 万输入令牌 0.30 美元和每 100 万输出令牌 2.50 美元略贵。但谷歌声称,新模型在性能上超越了 Gemini 2.5 Pro 模型,同时速度提高了三倍。而且,对于思考任务,它平均比 2.5 Pro 少使用 30% 的令牌。这意味着总的来说,对于某些任务,您可以在令牌数量上节省成本。
Gemini 模型产品高级总监兼负责人 Tulsee Doshi 在向 TechCrunch 简报时表示:“我们确实将 Flash 定位为更像您的主力模型。因此,如果您查看例如此表中顶部的输入和输出价格,Flash 在输入和输出价格方面提供了便宜得多的产品。因此,它实际上允许许多公司进行批量任务。”
自发布 Gemini 3 以来,谷歌在其 API 上每天处理超过 1 万亿个令牌,这正值其与 OpenAI 的激烈发布和性能竞争之际。
本月早些时候,据报道,在 ChatGPT 的流量下降,而谷歌在消费者市场的份额上升之后,Sam Altman 向 OpenAI 团队发送了一份内部“Code Red”备忘录,以应对竞争威胁并推迟广告推广。(据报道) 之后,OpenAI 发布了 GPT-5.2 (此链接指向关于谷歌发布新模型的文章,此处应为OpenAI反击) 和一款新的图像生成模型。OpenAI 还吹嘘其日益增长的企业使用情况,并表示自 2024 年 11 月以来 ChatGPT 的消息量已增长了 8 倍。
虽然谷歌没有直接回应与 OpenAI 的竞争,但它表示,新模型的发布正在挑战所有公司保持活跃。
Doshi 说:“业内正在发生的一切是,所有这些模型都在不断进步,相互挑战,推动前沿发展。而且我认为,随着公司发布这些模型,这也是很棒的。”
“我们也在引入新的基准测试和新的模型评估方式。因此,这也激励着我们。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区