📢 转载信息
原文链接:https://www.wired.com/story/amazon-nova-forge-ai-models/
原文作者:Will Knight
亚马逊公布了一系列新的前沿人工智能模型,以及一种让客户构建自己前沿模型的新方式。
这家电商巨头在拉斯维加斯举行的公司大会re:Invent上发布了第二代Nova AI模型。这些模型远不如OpenAI和谷歌等竞争对手提供的模型受欢迎,但亚马逊让它们高度可定制的计划可能会使其在云用户中获得关注。
亚马逊详细介绍了两个改进后的大型语言模型:Nova Lite和Nova Pro;一个名为Nova Sonic的新实时语音模型;以及一个更具实验性的模型Nova Omni,它使用图像、音频和视频以及文本进行模拟推理。这些新模型今天向有限数量的客户开放。
鉴于其云业务的重要性,更重要的是,亚马逊还发布了一个名为Nova Forge的工具,它将允许客户通过向未完成的Nova 2 Lite和Pro模型版本添加自己的训练数据来创建专业的前沿模型。
现在已经可以对谷歌的Gemini和OpenAI的GPT等现成AI模型进行微调。但亚马逊的方法允许客户在模型训练的不同阶段添加数据,包括构建基础模型的过程,这个阶段通常被称为自定义预训练,以往只对大型AI实验室开放。
亚马逊AI部门负责人Rohit Prasad在今天的发布会前接受WIRED采访时表示:“每个人都在寻找一个在他们领域具有专长的前沿模型。”普拉萨德说,亚马逊开发Nova Forge背后的技术是为了赋能内部团队,包括开发Alexa和AI代理的团队,以便构建自定义模型。“这本质上是一种新的开放式训练范式,”他说。
Reddit是已经测试过这种方法的客户之一,它使用Nova Forge创建了一个自定义模型,用于识别违反平台规则的内容。
Reddit首席技术官Chris Slowe表示,微调传统模型是行不通的,因为大多数模型的设计初衷是完全避免攻击性或暴力内容,这意味着它们会拒绝分析某些材料。Slowe说,自定义预训练与传统的微调相结合,产生了一个在理解和使用Reddit方面具有专长的前沿模型。
Slowe说:“其他LLM了解Reddit作为一个概念以及Reddit的运作方式,但它们没有深入细节。”他补充道,“我们真正构建了一个Reddit专家模型。”
Slowe补充说,Reddit的定制模型有多种用途,很可能会被用于自动化内容审核。
测试Nova Forge的其他公司包括Booking.com、索尼和生物技术公司Nimbus Therapeutics。
允许客户定制模型可能是明智之举,因为公司正在寻找超越最新通用模型能力的工具。根据咨询公司贝恩(Bain)11月发布的一项调查,约有四分之三的美国公司将人工智能视为重中之重。然而,这些公司在使用AI方面也报告了各种问题,其中包括缺乏构建自定义模型所需的专业知识和资源。
如今,大多数AI模型要么是封闭的,意味着只能通过API或应用程序访问;要么是开放的,意味着可以下载并在自己的硬件上运行。许多公司选择使用开放模型——最受欢迎的是来自阿里巴巴和DeepSeek等中国公司的模型——因为它们更便宜,更容易实验和修改。然而,用于训练这些开放模型的数据通常不会被发布,这限制并复杂化了调整过程。
Nova Forge提供了一种新方法,尽管它被锁定在亚马逊的云中。从头开始构建一个大型语言模型可能耗资数千万甚至数亿美元。普拉萨德表示,使用Nova Forge构建的前沿模型应该会便宜得多,但没有提供具体细节。
在AI竞赛中,亚马逊仍然像一个“黑马”,在开发真正前沿的AI语言模型方面起步较晚。然而,该公司正在悄悄地建立其先进AI能力组合。它还将生成式AI集成到其购物平台中,例如通过一个名为Rufus的专注于电子商务的聊天机器人助手。
与其他大型科技公司一样,亚马逊正在投入数十亿美元用于构建新的AI基础设施,这是对AI需求将继续保持强劲增长的一种巨大(且潜在风险巨大)的押注。
亚马逊正在与谷歌和微软争夺云客户。OpenAI也在快速构建自己的基础设施,并可能在未来成为一个云参与者。它通过向Anthropic(一家由离开ChatGPT制造商的员工创立的OpenAI的主要竞争对手)投资80亿美元来对冲风险。亚马逊还希望挑战英伟达的硬件主导地位;Anthropic的最新模型是在亚马逊的定制Trainium芯片上训练的。
亚马逊表示,Nova 2 Pro在各种基准测试中与OpenAI的GPT-5和GPT-5.1、谷歌的Gemini Pro 2.5和Gemini 3.0 Pro以及Anthropic的Sonnet 4.5相匹配或超越它们。普拉萨德指出,该模型在代理任务(如遵循复杂指令和使用计算机工具)方面尤其出色。该公司表示,其较小的模型Nova 2 Lite在各种基准测试中与Claude 4.5 Haiku、GPT-5 Mini和Gemini Flash 2.5相似。
Nova 2 Omni表明亚马逊在AI研究方面如今也毫不逊色。作为一个完全多模态推理模型,它可以将图像、音频和视频以及文本作为输入,并执行模拟推理以生成输出。普拉萨德表示,据他所知,没有其他AI公司发布过这种完全多模态模型。
Reddit的Slowe表示,Nova的可定制性可能是其最重要的特质。“我相信它有很大的潜力,”他说。“在许多情况下,它将比我们从现成的模型中获得的效果要好得多。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区