目 录CONTENT

文章目录

再见,GPT-5。你好,Qwen(通义千问)

Administrator
2025-12-27 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/expired-tired-wired-gpt-5/

原文作者:Will Knight


在今年夏天一个细雨纷飞、狂风呼啸的下午,我参观了位于中国杭州的初创公司 Rokid 的总部。这家公司正在开发智能眼镜。当我与工程师交谈时,他们说的话迅速地从普通话翻译成英语,并通过公司一款新的原型设备,转录到我右眼上方的一块微小半透明屏幕上。

Rokid 的高科技眼镜使用的是 Qwen(通义千问),这是中国电商巨头阿里巴巴开发的一个开放权重(open-weight)大语言模型。

Qwen——中文全称通义千问——并不是目前最好的AI模型。OpenAIGPT-5GoogleGemini 3,以及AnthropicClaude 在衡量机器聪明程度的基准测试中得分通常更高。Qwen 也不是第一个真正尖端的开放权重模型,那个头衔属于Meta 在 2023 年发布的Llama

然而,Qwen 以及来自 DeepSeek、月之暗面(Moonshot AI)、智谱(Z.ai)和 MiniMax 等其他中国模型越来越受欢迎,因为它们既非常出色又非常容易进行“修补”和修改。根据提供AI模型和代码访问的公司 HuggingFace 的数据,今年 7 月,其平台上中国开放模型的下载量超过了美国模型。DeepSeek 通过发布一个计算量远低于美国竞争对手的前沿大语言模型震惊了业界,但 OpenRouter(一个将查询路由到不同AI模型的平台)表示,Qwen 在今年迅速攀升,成为全球第二受欢迎的开放模型。

Qwen 可以完成先进AI模型所能做的大部分事情。对于 Rokid 的用户来说,这可能包括识别通过内置摄像头拍摄到的产品、获取地图导航、起草信息、搜索网络等等。由于 Qwen 可以轻松下载和修改,Rokid 托管了一个该模型的定制版本,并根据自身需求进行了微调。此外,一个微型版本的 Qwen 也可以在智能手机或其他设备上运行,以防互联网连接中断。

在去中国之前,我在我的MacBook Air上安装了一个小型 Qwen 版本,并用它来练习一些基础的普通话。对于许多用途来说,像 Qwen 这样规模适中的开源模型,与那些存在于大型数据中心中的巨型模型一样出色。

Qwen 和其他中国开放权重模型的崛起,恰逢过去 12 个月里一些著名的美国AI模型出现失误。当 Meta 于 2025 年 4 月推出 Llama 4 时,该模型的表现令人失望,未能达到 LM Arena 等热门基准测试的预期高度。这一失误让许多开发者开始寻找其他可以尝试的开放模型。

当 OpenAI 于 8 月推出其最新模型 GPT-5 时,也表现平平。一些用户抱怨其态度异常冷漠,另一些用户则发现了令人惊讶的简单错误。OpenAI 同月发布了一个功能较弱的开放模型 gpt-oss,但 Qwen 和其他中国模型仍然更受欢迎,因为它们在构建和更新方面投入了更多精力,而且其工程细节通常被广泛公布。

在顶级AI会议 NeurIPS 上发表的数百篇学术论文都使用了 Qwen。Laude Institute(一家为倡导美国开放模型而设立的非营利组织)的联合创始人 Andy Konwinski 说:“很多科学家都在使用 Qwen,因为它是最好的开放权重模型。”

中国AI公司所采取的开放性——它们会定期发布详细介绍新工程和训练技巧的论文——与美国大公司日益封闭的做法形成了鲜明对比。Konwinski 认为,美国大公司似乎害怕泄露自己的知识产权。Qwen 团队发布的一篇论文详细介绍了一种在训练中增强模型智能的方法,这篇论文被评为今年 NeurIPS 的最佳论文之一。

其他中国大公司正在利用 Qwen 进行原型设计和构建。在我访问 Rokid 前几天,我看到了中国领先的电动汽车制造商比亚迪(BYD)是如何将该模型集成到其新款仪表盘助手中的。美国公司也在采用 Qwen。Airbnb、Perplexity 和 Nvidia 都在使用 Qwen。就连曾经是开放模型先驱的 Meta,据说现在也在使用 Qwen 来帮助构建新模型。

Konwinski 认为,美国AI公司过于关注在衡量数学或编码技能等狭窄基准测试中获得微小优势,而忽视了确保其模型能在世界范围内产生重大影响。“当基准测试不能代表现实世界的使用情况或正在解决的问题时,你就会陷入这种疲倦、失调的状态,”他说。

Qwen 和类似模型的崛起似乎表明,除了一个AI模型有多聪明之外,衡量其价值的一个关键指标应该是它被用于构建其他事物的广泛程度。以这个标准来衡量,Qwen 和其他中国开放模型正处于上升期。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区