📢 转载信息
原文链接:https://techcrunch.com/2026/04/02/microsoft-takes-on-ai-rivals-with-three-new-foundational-models/
原文作者:Rebecca Szkutak / TechCrunch
微软旗下的AI研究实验室在周四宣布发布三款全新的基础AI模型,这些模型具备文本、语音和图像生成能力。此次发布标志着微软在构建自主多模态AI技术栈方面的持续投入,旨在与竞争对手的AI实验室直接抗衡,尽管该公司目前仍与OpenAI保持着紧密的合作伙伴关系。
模型能力解析
根据公司新闻稿显示,各模型的主要功能如下:
- MAI-Transcribe-1:支持将25种不同语言的语音转录为文本,且速度比微软Azure原有的Fast服务快2.5倍。
- MAI-Voice-1:这是一款音频生成模型,允许用户在仅需一秒钟的时间内生成60秒的音频,并支持创建自定义语音。
- MAI-Image-2:这是一款专注于视频生成的模型。
其中,MAI-Image-2 最初于3月19日在名为“MAI Playground”的大语言模型测试软件上发布。目前,这三款模型均已上线Microsoft Foundry平台,其中转录和语音模型也可在MAI Playground中体验。
战略定位与愿景
这些模型由微软MAI超级智能团队(MAI Superintelligence team)开发。该团队由微软AI首席执行官Mustafa Suleyman领导,成立于2025年11月。
“在微软AI,我们致力于打造‘人文AI’(Humanist AI)。我们在创建模型时有着独特的视角——将人类置于核心位置,优化人类真实的沟通方式,并针对实际应用进行训练。”Suleyman在博客文章中写道,“未来,你将会在Foundry以及微软的各项产品与体验中看到我们推出的更多模型。”
面对日益拥挤的LLM(大语言模型)市场,微软希望通过更具竞争力的价格来吸引用户,据公司称,其模型价格将低于Google和OpenAI的产品。
定价与合作关系
MAI-Transcribe-1 的起价为每小时0.36美元;MAI-Voice-1 的起价为每100万字符22美元;MAI-Image-2 的文本输入起价为每100万token 5美元,图像输出则为每100万token 33美元。
尽管发布了自己的模型,Suleyman在接受VentureBeat采访时重申了微软对OpenAI合作伙伴关系的承诺。不过,他也向媒体透露,该合作关系的近期重新谈判,确实为微软独立开展超级智能研究提供了空间。
目前,微软已向AI研究实验室投资超过130亿美元,并通过长期的合作伙伴关系将其模型整合至各类产品中。对于AI芯片,微软也采取了相似的策略:既自主研发,同时也向外部供应商采购。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区