登录体验完整功能(收藏、点赞、评论等) — 已累计有 12559 人加入

微软发布三款全新基础大模型 打响多模态AI赛道卡位战

详情页推荐

美国科技巨头微软于2026年4月推出三款全新基础大模型,上述产品由微软旗下成立仅6个月的MAI团队研发,覆盖语音转文字、音频生成、图像生成三大核心能力,直指当前多模态AI赛道主流竞品,旨在进一步扩大微软在全球生成式AI市场的话语权,与OpenAI、谷歌DeepMind等厂商展开直接竞争。


2026年以来,全球多模态AI赛道的竞争已经脱离早期通用大模型“堆参数”的粗放式增长阶段,头部厂商纷纷转向覆盖特定场景的轻量化基础模型布局,通过降低调用门槛、提升细分场景性能抢夺客户。此前谷歌DeepMind已推出面向音视频端侧场景的Gemini 2.5 Nano分支,OpenAI也开启了GPT-5语音交互功能的小范围灰度测试,业内普遍认为,多模态交互能力将成为下一代消费级和企业级AI产品的核心入口。

此次微软发布的三款基础大模型,全部由2025年10月才正式组建的MAI团队独立研发,成立仅半年就拿出落地产品,也侧面印证了微软对自研AI技术的投入强度。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。