谷歌宣布重大模型更新：Gemini 1.5 Pro性能提升显著-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://www.bbc.com/news/articles/c8dydlmenvro?at_medium=RSS&at_campaign=rss

原文作者：BBC News

谷歌在人工智能领域迈出了重要一步，宣布了其下一代大语言模型 Gemini 1.5 Pro 的重大升级。

Gemini 1.5 Pro 的核心飞跃

此次更新的核心亮点在于其惊人的 上下文窗口 能力。Gemini 1.5 Pro 现在可以处理高达 100 万个 Token 的输入，这一数字比其前身 Gemini 1.0 Pro 的 3.2 万个 Token 提升了超过 30 倍。

Token 是语言模型处理文本的基本单位，通常一个 Token 相当于大约四个英文字符或一个中文字符。这意味着 Gemini 1.5 Pro 能够一次性消化和理解一本书籍、数小时的视频或庞大的代码库。

谷歌表示，这种长上下文处理能力在多项严格的性能测试中表现出色。例如，在检索复杂文档中的信息时，新模型展现出了极高的准确性。

尽管上下文窗口大幅增加，谷歌强调 Gemini 1.5 Pro 在推理速度和效率上并未妥协。新模型是谷歌迄今为止最有效率的模型，与 1.0 版本相比，其性能显著提升，但计算成本却更低。

这主要得益于谷歌采用的一种名为 混合专家（Mixture-of-Experts, MoE） 的新架构。MoE 架构允许模型在处理特定任务时，只激活网络中与该任务相关的部分，而不是启动整个庞大模型，从而大大提高了计算效率。

“MoE 架构使我们能够以更低的成本，训练和部署更强大的模型，”一位谷歌研究人员指出。“Gemini 1.5 Pro 在推理速度上比 1.0 快得多，这对于需要实时响应的应用至关重要。”

Gemini 1.5 Pro 是一款原生多模态模型，意味着它可以同时理解、操作和推理不同类型的信息，包括文本、图像、音频和视频。

利用其长上下文窗口，用户可以上传一小时的视频或包含数万行代码的文件，然后要求模型对内容进行总结、提问或分析。例如，用户可以要求模型找出一部电影特定镜头的具体时间戳，或者分析一个大型软件项目的依赖关系。

谷歌目前正在向选定的开发者和企业客户提供 Gemini 1.5 Pro 的抢先体验（Preview）版本，主要通过 Google AI Studio 和 Vertex AI 平台进行测试。

尽管 100 万 Token 是当前的主要能力，谷歌表示，在未来他们计划将上下文窗口扩展到 200 万 Token，这进一步巩固了他们在AI长文本处理领域的领先地位。

此次发布被视为AI领域的一个重要里程碑，预示着下一代AI应用将能够处理更复杂、信息密度更高的任务，极大地拓宽了人工智能的应用边界。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。