宣称“从 0 构建”，印度 AI 实验室 Sarvam 发布两款 MoE 架构 LLM-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

宣称“从 0 构建”，印度 AI 实验室 Sarvam 发布两款 MoE 架构 LLM

Administrator

2026-02-21 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

02/21

📢 转载信息

原文链接：https://www.ithome.com/0/922/644.htm

原文作者：溯波（实习）

IT之家 2 月 20 日消息，印度 AI 实验室 Sarvam 当地时间本月 18 日在印度人工智能影响力峰会上发布了 2 款“从 0 构建”的最新一代 MoE 架构大语言模型。这两款模型即将在 Hugging Face 上以开源权重的形式提供，API 访问和仪表盘支持也将随后推出。

Sarvam 两款新模型中的较小型号采用 30B-A1B 设计，预训练数据集规模达 16T，支持 32K 上下文窗口，面向需求低延迟的实时应用场景；规模较大的型号则采用 105B-A9B 设计，支持 128K 上下文窗口，面向要求更为严苛的用例。

Sarvam 宣称其 105B-A9B 模型在本地化的印度语言基准测试中优于谷歌 Gemini 2.5 Flash 等竞争对手。而对于更广泛的工作负载，其“大多数基准测试中优于 DeepSeek R1，许多基准测试中优于谷歌 Gemini Flash”。

🚀 想要体验更好更全面的 AI 调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

宣称“从 0 构建”，印度 AI 实验室 Sarvam 发布两款 MoE 架构 LLM