目 录CONTENT

文章目录

谷歌推出Gemini 1.5 Pro:上下文窗口容量创纪录,成本降低一半

Administrator
2026-01-03 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.bbc.com/news/articles/c865n800d5jo?at_medium=RSS&at_campaign=rss

原文作者:BBC News


谷歌正在向部分开发者推出其最新的人工智能模型,该模型具备巨大的上下文窗口能力。


Gemini 1.5 Pro拥有一个100万个token的上下文窗口,是其前代产品容量的七倍。


Token是AI模型用来理解文本的基本单位,一个token大致相当于英文中的一个单词或一个字符。


上下文窗口的扩大意味着模型可以同时处理更多的信息。


谷歌表示,这个容量相当于同时处理一整本书、数小时的视频或数十万行代码。


它被设计用来帮助开发者更容易地构建更强大的应用程序。


谷歌DeepMind首席执行官戴米斯·哈萨比斯(Demis Hassabis)表示,该公司正在“引领下一代AI模型的创新”。


在旧金山举行的一次活动中,哈萨比斯先生说:“我们正在向开发者展示,他们在构建更强大的应用程序方面可以做些什么。”


Gemini 1.5 Pro的上下文窗口大小是其前代产品Gemini 1.0 Ultra的两倍,后者的容量为32,000个token


谷歌表示,这种容量的提升还伴随着成本的降低。


通过使用新的混合专家(Mixture-of-Experts, MoE)架构,Gemini 1.5 Pro的效率更高,这使得成本降低了50%


谷歌DeepMind产品管理副总裁萨姆·特纳(Sam Turrell)表示,模型的性能也比Gemini 1.0 Pro更强。


他还补充说:“我们正在努力确保它能达到与Gemini 1.0 Ultra相同的性能水平,甚至更高。”


该模型将在未来几周内通过Google AI Studio对开发者开放,并最终集成到谷歌的其他产品中,例如其聊天机器人Gemini


为了展示这一能力,谷歌展示了Gemini 1.5 Pro分析一整段视频的能力。


在演示中,模型能够根据用户提出的关于视频内容的特定问题进行准确回答,例如找出特定场景或人物。


它还可以总结长达数小时的视频内容,识别特定信息。


这项新技术也可能在编程领域带来变革。


在演示中,Gemini 1.5 Pro成功地分析了一个大型代码库,并能识别出其中错误或不一致的地方。


谷歌表示,该模型在多项基准测试中的表现都优于其前身,尤其是在长文本理解、代码和数学推理方面。


OpenAI等竞争对手也发布了具有强大上下文窗口能力的AI模型。


OpenAI的GPT-4 Turbo模型拥有128,000个token的上下文窗口。


然而,谷歌的Gemini 1.5 Pro在100万token的规模上保持了高准确性,这一点非常引人注目。


谷歌的Gemini 1.5 Pro模型发布,上下文窗口容量创下新高。

AI模型领域的竞争日益激烈,特别是自OpenAI的ChatGPT推出以来。


谷歌的这一发布被视为对OpenAI及其主要投资者微软的有力回应。


谷歌去年发布了第一代Gemini模型,目标是超越OpenAI。


但许多评论家认为,OpenAI在发布GPT-4时处于领先地位。


谷歌现在正通过推出Gemini 1.5 Pro,并专注于扩大其处理大量信息的能力,试图重新确立其市场地位。


Gemini 1.5 Pro目前正向选定的开发者开放,以便他们可以开始构建基于这一新功能的应用。


预计它将在今年晚些时候向更广泛的受众推出,并最终集成到谷歌的旗舰AI产品中。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区