Mixture-of-Experts-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

行动起来，活在当下

累计撰写 7268 篇文章
累计创建 3256 个标签
累计收到 0 条评论

目录CONTENT

以下是 Mixture-of-Experts 相关的文章

2026-03-12
英伟达发布最强开源AI模型Nemotron 3 Super：1200亿参数，吞吐量飙升5倍英伟达发布了其迄今为止最强大的开源权重AI模型Nemotron 3 Super，拥有1200亿参数，采用混合专家（MoE）架构。该模型专为大规模运行复杂智能体系统设计，能显著提升吞吐量5倍，准确率翻倍，并配备100万Token的超长上下文窗口，有效解决企业级AI应用中的“上下文爆炸”与“推理税”瓶颈。
- 2026-03-12
- 1
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-02-20
英伟达Blackwell架构将AI推理成本压缩至十分之一英伟达Blackwell架构在AI推理领域实现了重大突破，通过极致的软硬件协同设计，将单位Token的生成成本相比上一代Hopper架构降低了惊人的90%，即压缩至十分之一。多家推理服务商已开始利用该平台托管开源模型，实现了显著的成本缩减和效率提升。旗舰系统GB200 NVL72凭借其72个芯片互联和高速共享内存，完美适配当前主流的混合专家（MoE）架构需求，为AI基础设施带来了革命性的效率提升。
- 2026-02-20
- 1
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-02-12
NVIDIA Nemotron 3 Nano 30B MoE 模型现已在 Amazon SageMaker JumpStart 中提供我们很高兴地宣布，NVIDIA Nemotron 3 Nano 30B（含3B激活参数）MoE 模型现已在 Amazon SageMaker JumpStart 模型目录中正式发布。开发者无需管理复杂的模型部署，即可利用 SageMaker JumpStart 的托管部署能力，快速在 AWS 上为生成式AI应用提供动力。该模型在编码和推理方面表现出色，支持高达100万个Token的上下文窗口。
- 2026-02-12
- 3
- 0
- 0
2026-02-10
谷歌 Gemini 1.5 Pro 预览版发布：原生支持 100 万上下文窗口，可处理 1500 页文档或 1 小时视频谷歌正式推出了下一代 AI 模型 Gemini 1.5 Pro 预览版，该模型最引人注目的升级是其原生支持高达 100 万个上下文 token，在特定情况下甚至可扩展至 200 万 token。这一能力使其能够一次性处理海量信息，例如完整的书籍、11 小时的音频或 1 小时的视频内容，从而极大地提升了 AI 的理解和推理深度。Gemini 1.5 Pro 采用了新的 Mixture-of-Experts (MoE) 架构，在保持高性能的同时，显著提高了推理效率和速度，为开发者和企业带来了更...
- 2026-02-10
- 1
- 0
- 0