📢 转载信息
原文作者:Julie Bort
业界很多人认为,AI模型市场的赢家已经确定:将由大型科技公司(谷歌、Meta、微软,加上少量的亚马逊)以及他们选择的模型制造商(主要是OpenAI和Anthropic)主导。
然而,这家仅有30人的初创公司 Arcee AI 却持不同意见。该公司刚刚发布了一个真正且永久开放(Apache 许可证)的通用基础模型,名为 Trinity。Arcee声称,其4000亿参数的Trinity是美国公司训练和发布的最大规模的开源基础模型之一。
根据使用基础模型(即很少进行后期训练的模型)进行的基准测试,Arcee表示Trinity与Meta的Llama 4 Maverick 400B以及来自中国清华大学的高性能开源模型Z.ai的GLM-4.5相媲美。
与其它最先进(SOTA)模型一样,Trinity也专注于编码和多步骤任务,例如智能体(agents)。不过,尽管其规模庞大,它目前仅支持文本,因此还不是真正的SOTA竞争者。
首席技术官Lucas Atkins(上图左)告诉TechCrunch,更多模式正在开发中——视觉模型正在开发中,语音转文本版本已在路线图上。相比之下,Meta的Llama 4 Maverick已经是多模态的,支持文本和图像。
但在增加更多AI模式之前,Arcee表示,它希望拥有一个能够打动其主要目标客户——开发者和学者的基础LLM。该团队尤其希望将美国各规模的公司从选择中国开源模型中拉走。
“归根结底,这场游戏的赢家,以及真正赢得用户的方式,是拥有最好的开放权重模型,” Atkins说。“要赢得开发者的心智,你必须提供最好的。”
基准测试显示,目前处于预览阶段、正在进行更多后期训练的Trinity基础模型,在编码、数学、常识、知识和推理等常见测试中,基本能与Llama持平,在某些情况下甚至略有胜出。
Arcee在成为一个有竞争力的AI实验室方面所取得的进展令人印象深刻。这个大型Trinity模型是在去年12月发布的两个先前的小型模型之后出现的:260亿参数的Trinity Mini,这是一个完全后期训练的推理模型,适用于从Web应用到智能体等任务;以及60亿参数的Trinity Nano,这是一个实验性模型,旨在突破微小却善于聊天的模型的界限。
最引人注目的是,Arcee仅用六个月时间,花费了总计2000万美元,使用了2048个Nvidia Blackwell B300 GPU训练了所有这些模型。创始人兼首席执行官Mark McQuade(上图右)表示,这笔费用约占公司迄今筹集资金总额的一半。
Atkins领导了模型构建工作,他承认这笔资金“对我们来说是一笔巨款”,但他同时也承认,这与目前更大规模的实验室的开支相比仍然相形见绌。
Atkins的职业生涯在转向LLM之前是为汽车构建语音代理。他说,六个月的时间“是经过非常精心的计算的”。“我们是一家年轻、极其饥渴的初创公司。我们拥有大量的人才和杰出的年轻研究人员,当他们有机会花费这笔资金并训练如此规模的模型时,我们相信他们会不负众望。他们确实做到了,尽管经历了无数个不眠之夜和漫长的工作时间。”
McQuade曾是开源模型市场Hugging Face的早期员工,他表示Arcee最初的目标并非成为一个新的美国AI实验室:该公司最初是为SK Telecom等大型企业客户提供模型定制服务。
“我们最初只做后期训练。我们会借鉴他人的出色工作:我们会拿一个Llama模型、一个Mistral模型或一个开源的Qwen模型,然后对其进行后期训练,使其更适合公司预期的用途,”他说,这其中也包括强化学习。
但随着客户群的扩大,Atkins表示,对自有模型的需求正成为一种必要,而且McQuade担心过度依赖其他公司。与此同时,许多最好的开源模型来自中国,而美国企业对此心存疑虑,甚至被禁止使用。
这是一个令人紧张的决定。“我认为世界上只有不到20家公司曾经预训练并发布了自己的模型”,其规模和水平是Arcee所追求的,McQuade说。
该公司最初从小处着手,与训练公司DatologyAI合作开发了一个微小的45亿参数模型。该项目的成功鼓励了更大的尝试。
但如果美国已经有了Llama,为什么还需要另一个开放权重模型呢?Atkins表示,通过选择Apache开源许可证,这家初创公司承诺永远保持其模型的开放性。这正值Meta首席执行官马克·扎克伯格去年暗示他的公司可能不会永远将其所有最先进的模型开源之际。
他说道:“Llama采用Meta控制的许可证,带有商业和使用限制,因此可以被视为不算真正开源。”这导致一些开源组织声称Llama完全不符合开源规范。
McQuade说:“Arcee之所以存在,是因为美国需要一个永久开放、采用Apache许可证、前沿级别的替代品,并且该替代品能够在当今的前沿水平上进行竞争。”
所有Trinity模型,无论大小,都可以免费下载。最大的版本将以三种形式发布。Trinity Large Preview是一个经过轻微后期训练的指令模型,这意味着它经过训练可以遵循人类指令,而不仅仅是预测下一个词,这使其适用于通用聊天场景。Trinity Large Base是没有经过后期训练的基础模型。
然后是TrueBase,这是一个没有任何指令数据或后期训练的模型,以便希望对其进行定制的企业或研究人员无需撤销任何数据、规则或假设。
Arcee AI最终将提供其通用发布模型的托管版本,并声称其API定价具有竞争力。该版本预计在六周内发布,因为初创公司仍在继续改进模型的推理训练。
Trinity Mini的API定价为$0.045 / $0.15,并且还有一个速率限制的免费层可供使用。与此同时,该公司仍然销售后期训练和定制选项。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区