目 录CONTENT

文章目录

谷歌发布 Gemini 3,推出新型编程界面,基准测试创纪录

Administrator
2025-11-19 / 0 评论 / 0 点赞 / 1 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2025/11/18/google-launches-gemini-3-with-new-coding-app-and-record-benchmark-scores/

原文作者:Russell Brandom


周二,谷歌 发布了 Gemini 3,这是其最新、最先进的基础模型,现已可通过 Gemini 应用和 AI 搜索界面立即使用。

此次发布距离 Gemini 2.5 发布仅过去七个月,新模型是谷歌迄今为止能力最强的LLM,并立即成为市场上最具实力的AI工具的竞争者。此次发布距离OpenAI发布GPT 5.1还不到一周,距离Anthropic发布Sonnet 4.5也才两个月——这再次提醒我们前沿模型开发的惊人速度。

一个更侧重研究的版本,名为 Gemini 3 Deepthink,在通过更多安全测试后,也将在未来几周内向 Google AI Ultra 订阅用户开放。

谷歌 Gemini 模型产品负责人 Tulsee Doshi 表示:“通过 Gemini 3,我们看到了推理能力的巨大飞跃。它所提供的深度和细微差别是我们以前从未见过的。”

这种推理能力已经在独立基准测试中有所体现。该模型在 “人类的最后考试”(Humanity’s Last Exam)基准测试中获得了 37.4 的分数,创下了新的最高记录,该测试旨在衡量通用推理和专业知识。此前的最高分由 GPT-5 Pro 保持,为 31.64 分。Gemini 3 在 LMArena(一个衡量用户满意度的人工主导基准)上也位居榜首。

据谷歌称,Gemini 应用目前拥有超过 6.5 亿月活跃用户,并且已有 1300 万软件开发者将该模型用作其工作流程的一部分。

除了基础模型,谷歌还发布了一个名为 Google Antigravity 的 Gemini 驱动的编码界面,它支持类似 Warp 或 Cursor 2.0 等代理式 IDE 的多窗格代理式编程。具体来说,Antigravity 将一个类似 ChatGPT 的提示窗口与命令行界面以及一个可以显示编码代理所做更改影响的浏览器窗口结合在一起。

DeepMind 首席技术官 Koray Kavukcuoglu 说:“该代理可以与您的编辑器、终端、浏览器协同工作,以确保它能以最佳方式帮助您构建应用程序。”




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区