少找工具,多做创作

微软加码自研AI大模型 2027年目标多模态能力全球领先

2026年4月,微软披露最新AI战略规划,由公司AI业务负责人苏莱曼牵头推进自研大模型研发,计划2027年前在文本、图像、音频处理能力上达到全球领先水平,打破长期以来对OpenAI等外部合作伙伴的技术依赖。目前微软正大规模部署英伟达GB200芯片集群,首批自研语音转录模型已在11种语言任务上超越行业同类产品。

2026年4月2日,微软低调上线了一款全新自研语音转录模型,没有铺天盖地的宣传,却释放出这家科技巨头在AI赛道的战略转向信号——此前高度依赖外部合作伙伴的通用大模型业务,正在加速转向自主研发。

作为OpenAI最早也是最大的机构投资方,微软过去数年的AI业务核心基本围绕OpenAI的GPT系列模型展开,从Azure云的AI算力服务到Copilot全系办公产品,底层技术都高度绑定OpenAI的供给。但随着全球大模型竞争进入白热化,这种绑定模式的不确定性也逐渐凸显,此前双方的合作协议曾多次因OpenAI的内部变动出现波动,也让微软意识到核心技术自主可控的重要性。

微软AI负责人苏莱曼此前在内部沟通中明确提及,自主掌握核心大模型技术是微软下一阶段AI业务的核心目标,2027年实现多模态能力全球领先的节点,正是为了追上甚至超越当前的第一梯队玩家OpenAI和Anthropic。

为了支撑自研模型的快速迭代,微软已经启动了规模空前的算力基础设施升级,英伟达最新一代GB200芯片集群正在微软全球数据中心大规模部署,按照规划,未来12-18个月内,微软的AI算力规模将达到全球顶尖水平,足以支撑超大规模多模态模型的训练与微调需求。

而4月2日发布的语音转录模型正是自研路线的首个阶段性成果:测试数据显示,在覆盖全球主流使用者的25种语言中,该模型在11种语言的语音识别准确率、降噪能力等核心指标上超过了当前市场上的同类产品,验证了微软自研团队的技术实力。

此前全球通用大模型赛道的第一梯队基本由创业公司和谷歌等科技巨头的独立实验室主导,OpenAI、Anthropic、谷歌DeepMind等玩家占据了技术高地,而微软下场自研,相当于给这条赛道增加了一个兼具算力、资金、落地场景优势的重量级玩家。

行业分析认为,微软的入局一方面会推动多模态AI技术的迭代速度进一步加快,文本、图像、音频跨模态融合的落地场景可能会在未来2-3年出现爆发式增长,另一方面也可能改变当前科技公司与AI创业公司的合作生态,后续微软与OpenAI的现有合作模式是否会调整,也成为行业关注的核心焦点。

AI生成配图

(图像由AI生成)

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创