谷歌新Gemini Pro模型再次刷新基准测试分数纪录-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

谷歌新Gemini Pro模型再次刷新基准测试分数纪录

Administrator

2026-02-20 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

02/20

📢 转载信息

原文链接：https://techcrunch.com/2026/02/19/googles-new-gemini-pro-model-has-record-benchmark-scores-again/

原文作者：Lucas Ropek

周四，谷歌发布了其强大的大语言模型Gemini Pro的最新版本。该公司表示，该模型（3.1版本）目前可作为预览版使用，并将很快全面发布。

谷歌的这款新模型可能是迄今为止最强大的LLM之一。观察人士指出，Gemini 3.1 Pro似乎比其前身Gemini 3有了一个巨大的飞跃——Gemini 3在去年11月发布时，已被认为是一个能力极强的人工智能工具。

Google Gemini

周四，谷歌还分享了来自独立基准测试（例如一个名为“人类的最后一项考试”的测试）的统计数据，这些数据表明其性能明显优于前一个版本。

AI初创公司Mercor的首席执行官Brendan Foody也对Gemini 3.1 Pro大加赞赏。Mercor的基准测试系统APEX旨在衡量新AI模型在执行真实专业任务方面的表现。Foody在社交媒体帖子中表示：“Gemini 3.1 Pro现已位居APEX-Agents排行榜榜首”，并补充说，该模型的惊人结果表明了“智能体在真实知识工作方面改进的速度有多快。”

此次发布正值AI模型大战愈演愈烈之际，科技公司正持续发布专为智能体工作和多步推理设计的、功能日益强大的LLM。包括OpenAI和Anthropic在内的其他主要竞争者最近也发布了新模型。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

谷歌新Gemini Pro模型再次刷新基准测试分数纪录

评论区