目 录CONTENT

文章目录

谷歌新Gemini Pro模型再次刷新基准测试分数纪录

Administrator
2026-02-20 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2026/02/19/googles-new-gemini-pro-model-has-record-benchmark-scores-again/

原文作者:Lucas Ropek


周四,谷歌 发布了其强大的大语言模型Gemini Pro的最新版本。该公司表示,该模型(3.1版本)目前可作为预览版使用,并将很快全面发布。

谷歌的这款新模型可能是迄今为止最强大的LLM之一。观察人士指出,Gemini 3.1 Pro似乎比其前身Gemini 3有了一个巨大的飞跃——Gemini 3在去年11月发布时,已被认为是一个能力极强的人工智能工具。

Google Gemini

周四,谷歌还分享了来自独立基准测试(例如一个名为“人类的最后一项考试”的测试)的统计数据,这些数据表明其性能明显优于前一个版本。

AI初创公司Mercor的首席执行官Brendan Foody也对Gemini 3.1 Pro大加赞赏。Mercor的基准测试系统APEX旨在衡量新AI模型在执行真实专业任务方面的表现。Foody在社交媒体帖子中表示:“Gemini 3.1 Pro现已位居APEX-Agents排行榜榜首”,并补充说,该模型的惊人结果表明了“智能体在真实知识工作方面改进的速度有多快。”

此次发布正值AI模型大战愈演愈烈之际,科技公司正持续发布专为智能体工作和多步推理设计的、功能日益强大的LLM。包括OpenAI和Anthropic在内的其他主要竞争者最近也发布了新模型。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区