谷歌推出Gemini 1.5 Pro：上下文窗口容量创纪录，成本降低一半-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://www.bbc.com/news/articles/c865n800d5jo?at_medium=RSS&at_campaign=rss

原文作者：BBC News

谷歌正在向部分开发者推出其最新的人工智能模型，该模型具备巨大的上下文窗口能力。

Gemini 1.5 Pro拥有一个100万个token的上下文窗口，是其前代产品容量的七倍。

Token是AI模型用来理解文本的基本单位，一个token大致相当于英文中的一个单词或一个字符。

上下文窗口的扩大意味着模型可以同时处理更多的信息。

谷歌表示，这个容量相当于同时处理一整本书、数小时的视频或数十万行代码。

它被设计用来帮助开发者更容易地构建更强大的应用程序。

谷歌DeepMind首席执行官戴米斯·哈萨比斯（Demis Hassabis）表示，该公司正在“引领下一代AI模型的创新”。

在旧金山举行的一次活动中，哈萨比斯先生说：“我们正在向开发者展示，他们在构建更强大的应用程序方面可以做些什么。”

Gemini 1.5 Pro的上下文窗口大小是其前代产品Gemini 1.0 Ultra的两倍，后者的容量为32,000个token。

谷歌表示，这种容量的提升还伴随着成本的降低。

通过使用新的混合专家（Mixture-of-Experts, MoE）架构，Gemini 1.5 Pro的效率更高，这使得成本降低了50%。

谷歌DeepMind产品管理副总裁萨姆·特纳（Sam Turrell）表示，模型的性能也比Gemini 1.0 Pro更强。

他还补充说：“我们正在努力确保它能达到与Gemini 1.0 Ultra相同的性能水平，甚至更高。”

该模型将在未来几周内通过Google AI Studio对开发者开放，并最终集成到谷歌的其他产品中，例如其聊天机器人Gemini。

为了展示这一能力，谷歌展示了Gemini 1.5 Pro分析一整段视频的能力。

在演示中，模型能够根据用户提出的关于视频内容的特定问题进行准确回答，例如找出特定场景或人物。

它还可以总结长达数小时的视频内容，识别特定信息。

这项新技术也可能在编程领域带来变革。

在演示中，Gemini 1.5 Pro成功地分析了一个大型代码库，并能识别出其中错误或不一致的地方。

谷歌表示，该模型在多项基准测试中的表现都优于其前身，尤其是在长文本理解、代码和数学推理方面。

OpenAI等竞争对手也发布了具有强大上下文窗口能力的AI模型。

OpenAI的GPT-4 Turbo模型拥有128,000个token的上下文窗口。

然而，谷歌的Gemini 1.5 Pro在100万token的规模上保持了高准确性，这一点非常引人注目。

AI模型领域的竞争日益激烈，特别是自OpenAI的ChatGPT推出以来。

谷歌的这一发布被视为对OpenAI及其主要投资者微软的有力回应。

谷歌去年发布了第一代Gemini模型，目标是超越OpenAI。

但许多评论家认为，OpenAI在发布GPT-4时处于领先地位。

谷歌现在正通过推出Gemini 1.5 Pro，并专注于扩大其处理大量信息的能力，试图重新确立其市场地位。

Gemini 1.5 Pro目前正向选定的开发者开放，以便他们可以开始构建基于这一新功能的应用。

预计它将在今年晚些时候向更广泛的受众推出，并最终集成到谷歌的旗舰AI产品中。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

谷歌推出Gemini 1.5 Pro：上下文窗口容量创纪录，成本降低一半