微软推出三款基础AI模型，正式向AI竞争对手发起挑战-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://techcrunch.com/2026/04/02/microsoft-takes-on-ai-rivals-with-three-new-foundational-models/

原文作者：Rebecca Szkutak / TechCrunch

微软旗下的AI研究实验室在周四宣布发布三款全新的基础AI模型，这些模型具备文本、语音和图像生成能力。此次发布标志着微软在构建自主多模态AI技术栈方面的持续投入，旨在与竞争对手的AI实验室直接抗衡，尽管该公司目前仍与OpenAI保持着紧密的合作伙伴关系。

模型能力解析

根据公司新闻稿显示，各模型的主要功能如下：

MAI-Transcribe-1：支持将25种不同语言的语音转录为文本，且速度比微软Azure原有的Fast服务快2.5倍。
MAI-Voice-1：这是一款音频生成模型，允许用户在仅需一秒钟的时间内生成60秒的音频，并支持创建自定义语音。
MAI-Image-2：这是一款专注于视频生成的模型。

其中，MAI-Image-2 最初于3月19日在名为“MAI Playground”的大语言模型测试软件上发布。目前，这三款模型均已上线Microsoft Foundry平台，其中转录和语音模型也可在MAI Playground中体验。

战略定位与愿景

这些模型由微软MAI超级智能团队（MAI Superintelligence team）开发。该团队由微软AI首席执行官Mustafa Suleyman领导，成立于2025年11月。

“在微软AI，我们致力于打造‘人文AI’（Humanist AI）。我们在创建模型时有着独特的视角——将人类置于核心位置，优化人类真实的沟通方式，并针对实际应用进行训练。”Suleyman在博客文章中写道，“未来，你将会在Foundry以及微软的各项产品与体验中看到我们推出的更多模型。”

面对日益拥挤的LLM（大语言模型）市场，微软希望通过更具竞争力的价格来吸引用户，据公司称，其模型价格将低于Google和OpenAI的产品。

定价与合作关系

MAI-Transcribe-1 的起价为每小时0.36美元；MAI-Voice-1 的起价为每100万字符22美元；MAI-Image-2 的文本输入起价为每100万token 5美元，图像输出则为每100万token 33美元。

尽管发布了自己的模型，Suleyman在接受VentureBeat采访时重申了微软对OpenAI合作伙伴关系的承诺。不过，他也向媒体透露，该合作关系的近期重新谈判，确实为微软独立开展超级智能研究提供了空间。

目前，微软已向AI研究实验室投资超过130亿美元，并通过长期的合作伙伴关系将其模型整合至各类产品中。对于AI芯片，微软也采取了相似的策略：既自主研发，同时也向外部供应商采购。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

微软推出三款基础AI模型，正式向AI竞争对手发起挑战

模型能力解析

战略定位与愿景

定价与合作关系

评论区