目 录CONTENT

文章目录

谷歌宣布重大模型更新:Gemini 1.5 Pro性能提升显著

Administrator
2025-12-30 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.bbc.com/news/articles/c8dydlmenvro?at_medium=RSS&at_campaign=rss

原文作者:BBC News


谷歌在人工智能领域迈出了重要一步,宣布了其下一代大语言模型 Gemini 1.5 Pro 的重大升级。

Gemini 1.5 Pro 的核心飞跃

此次更新的核心亮点在于其惊人的 上下文窗口 能力。Gemini 1.5 Pro 现在可以处理高达 100 万个 Token 的输入,这一数字比其前身 Gemini 1.0 Pro 的 3.2 万个 Token 提升了超过 30 倍。

Token 是语言模型处理文本的基本单位,通常一个 Token 相当于大约四个英文字符或一个中文字符。这意味着 Gemini 1.5 Pro 能够一次性消化和理解一本书籍、数小时的视频或庞大的代码库。

谷歌表示,这种长上下文处理能力在多项严格的性能测试中表现出色。例如,在检索复杂文档中的信息时,新模型展现出了极高的准确性。

性能与效率的平衡

尽管上下文窗口大幅增加,谷歌强调 Gemini 1.5 Pro 在推理速度和效率上并未妥协。新模型是谷歌迄今为止最有效率的模型,与 1.0 版本相比,其性能显著提升,但计算成本却更低。

这主要得益于谷歌采用的一种名为 混合专家(Mixture-of-Experts, MoE) 的新架构。MoE 架构允许模型在处理特定任务时,只激活网络中与该任务相关的部分,而不是启动整个庞大模型,从而大大提高了计算效率。

“MoE 架构使我们能够以更低的成本,训练和部署更强大的模型,”一位谷歌研究人员指出。“Gemini 1.5 Pro 在推理速度上比 1.0 快得多,这对于需要实时响应的应用至关重要。”

多模态能力的增强

Gemini 1.5 Pro 是一款原生多模态模型,意味着它可以同时理解、操作和推理不同类型的信息,包括文本、图像、音频和视频。

利用其长上下文窗口,用户可以上传一小时的视频或包含数万行代码的文件,然后要求模型对内容进行总结、提问或分析。例如,用户可以要求模型找出一部电影特定镜头的具体时间戳,或者分析一个大型软件项目的依赖关系。

发布计划与展望

谷歌目前正在向选定的开发者和企业客户提供 Gemini 1.5 Pro 的抢先体验(Preview)版本,主要通过 Google AI StudioVertex AI 平台进行测试。

尽管 100 万 Token 是当前的主要能力,谷歌表示,在未来他们计划将上下文窗口扩展到 200 万 Token,这进一步巩固了他们在AI长文本处理领域的领先地位。

此次发布被视为AI领域的一个重要里程碑,预示着下一代AI应用将能够处理更复杂、信息密度更高的任务,极大地拓宽了人工智能的应用边界。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区