📢 转载信息
原文链接:https://www.wired.com/story/prime-intellect-startup-us-deepseek-moment/
原文作者:Will Knight
DeepSeek的崛起与开源AI的未来展望
自DeepSeek在今年一月横空出世以来,开源中文人工智能模型(AI)领域的势头日益强劲。一些研究人员呼吁采取更加开放的AI构建方式,以便将模型开发工作分布式地推向全球。
专注于去中心化AI的初创公司Prime Intellect,目前正在训练其前沿大型语言模型INTELLECT-3。该公司声称,他们采用了一种新型的分布式强化学习(Reinforcement Learning, RL)方法进行微调。Prime Intellect的首席执行官Vincent Weisser表示,该模型将展示一种不依赖大型科技公司、利用不同地点各种硬件来构建具有竞争力的开放AI模型的新途径。
Weisser指出,当前的AI领域存在明显的分歧:一方依赖于闭源的美国模型,另一方则使用开源的中国产品。Prime Intellect正在开发的这项技术,通过让更多人能够自行构建和修改先进的AI,实现了AI的民主化。
强化学习:当前AI能力扩展的瓶颈
改进AI模型已不再仅仅依赖于堆砌训练数据和计算资源。如今的前沿模型利用强化学习在预训练完成后进行自我改进。如果你希望模型在数学、法律问答或数独方面表现出色,你需要让它通过在特定环境中进行实践来衡量成功和失败,并从中学习。
Weisser告诉我:“这些强化学习环境现在已成为真正扩展AI能力的主要瓶颈。”
Prime Intellect已经开发了一个框架,允许任何人根据特定任务创建定制化的强化学习环境。该公司正在结合其团队和社区创建的最佳环境来调优INTELLECT-3。
我尝试运行了Prime Intellect研究员Will Brown创建的一个用于解决Wordle谜题的环境。我看到一个小模型有条不紊地(老实说,比我更有条理)解开了Wordle谜题。如果我是一名AI研究人员,想要改进这个模型,我会启动多组GPU,让模型一遍又一遍地练习,同时一个强化学习算法会不断修改其权重,最终将模型打造成Wordle大师。
打破壁垒,释放创新潜力
尽管强化学习至关重要,但目前它主要由大型AI公司在“闭门造车”中完成。这个过程通常需要大量的专业知识,使得大多数公司和开发者难以企及。Weisser认为,允许初创公司进行自己的强化学习,有望催生出大量有价值的新软件产品,包括针对各种任务的专业智能体(agents)。
一些专家对此表示赞同。特斯拉AI团队前负责人Andrej Karpathy在Prime Intellect宣布其强化学习环境后不久,就称赞其为“一项了不起的努力和想法”。他鼓励开源研究人员采用不同的环境,并将其适应于新任务,以新的方式提升先进模型的技能。
Prime Intellect已经证明,分布式方法——包括划分计算任务然后合并结果以创建单一、更大的模型——可以挑战传统的AI构建方式。在2024年底,该公司发布了INTELLECT-1,一个使用分布式硬件训练的100亿参数模型。到了今年三月,他们发布了更大、更强大的INTELLECT-2,其推理能力得益于分布式强化学习。
在过去两年里,AI格局发生了巨大变化。Meta在2023年发布了首个Llama模型版本,开启了开源AI时代,但该公司在2025年4月发布的最新版本却令人大失所望。与此同时,中国一家名不见经传的初创公司DeepSeek,于2025年1月推出了一个具有强大推理能力的低成本模型,震惊了世界。随后,其他几款中国AI模型也纷纷效仿。OpenAI对此的回应是在八月发布了多年来的首个开源模型,但中国的模型如阿里的Qwen、月之暗面的Kimi以及DeepSeek的R1,可能因其易于修改和定制的特性而更受欢迎。
Weisser告诉我:“感觉美国在开放前沿模型方面几乎没有选择了。这也是我们正在努力改变的事情之一。”
您对Prime Intellect的方法有何看法?请发送邮件至 ailab@wired.com 告知我们。
这是Will Knight的AI Lab新闻邮件的其中一期。过往邮件请见此处。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区