2026年4月3日,微软正式发布自研MAI系列第三款AI模型MAI-Transcribe-1,该语音转写模型在FLEURS基准测试中实现25种语言平均词错误率仅3.9%,11种核心语言转写精度登顶,性能优于OpenAI Whisper-large-v3、Google Gemini 3.1 Flash等同类产品,是目前全球精度最高的通用多语种语音转写模型。
对经常处理会议记录、海外内容译制的从业者而言,语音转写的准确率直接决定了工作效率——过去行业主流模型动辄7%以上的平均词错误率,意味着每100个字就需要手动修改7个以上,多语种场景下误差更是动辄翻倍。
词错误率是衡量语音转写模型性能的核心指标,数值越低代表转写准确率越高,3.9%的平均词错误率已经接近人工转写的误差范围。根据微软公开的FLEURS基准测试结果,MAI-Transcribe-1在覆盖全球80%以上使用人口的25种语言中,平均词错误率较此前行业最优水平降低了近40%;其中英语、法语、德语等11种核心语言的转写精度更是全部位列第一,远高于OpenAI Whisper-large-v3、Google Gemini 3.1 Flash等同类产品。
作为微软MAI系列的第三款自研模型,该产品此前已经有语音合成模型MAI-Voice-1、图像生成模型MAI-Image-2两款落地,也标志着微软自研模型的技术边界正在不断拓展。
据微软披露,MAI-Transcribe-1已经完成了多场景适配,针对口音容错、专业术语识别、背景噪音过滤等行业痛点做了专项优化,即便在参会者带口音、现场有背景杂音的线下会议场景中,转写准确率也能保持在95%以上。目前该模型可覆盖会议记录、媒体内容转写、多语种客服质检、在线教育字幕生成等多个商用场景,不少跨境企业、媒体机构已经开始测试该模型的商用接口,预计最快2026年第二季度就会正式对外开放商用服务。
业内人士预测,该模型后续大概率会接入微软Teams、Office 365等自有生态产品,进一步提升办公套件的核心竞争力。
此前微软的AI服务多绑定OpenAI的GPT系列模型展开,而MAI系列自研模型矩阵的接连推出,意味着微软正在搭建完全自主可控的多模态AI能力体系,覆盖图像、语音的生成与识别全链路,未来或将进一步降低对外部技术的依赖,巩固自己在To B AI服务市场的优势地位。
与此同时,此前语音转写赛道的头部位置长期被OpenAI Whisper系列占据,微软此次推出的新产品直接打破了这一格局,也意味着大模型赛道的细分领域竞争正在进入白热化阶段,技术迭代速度还在不断加快。

(图像由AI生成)

6 分钟前
2026年4月披露的最新规划显示,微软正全面推进AI自主化战略转型,计划2027年推出自研尖端多模态大模型,实现文本、图像、音频处理能力全行业领先,直接对标OpenAI、Anthropic等头部厂商。为支撑该计划,微软已启动英伟达GB200芯片集群部署,未来12-18个月算力将大幅提升,同时仍将维持多元化AI生态布局。

2 小时前
2026年4月,微软披露最新AI战略规划,由公司AI业务负责人苏莱曼牵头推进自研大模型研发,计划2027年前在文本、图像、音频处理能力上达到全球领先水平,打破长期以来对OpenAI等外部合作伙伴的技术依赖。目前微软正大规模部署英伟达GB200芯片集群,首批自研语音转录模型已在11种语言任务上超越行业同类产品。

10 小时前
美国科技巨头微软于2026年4月推出三款全新基础大模型,上述产品由微软旗下成立仅6个月的MAI团队研发,覆盖语音转文字、音频生成、图像生成三大核心能力,直指当前多模态AI赛道主流竞品,旨在进一步扩大微软在全球生成式AI市场的话语权,与OpenAI、谷歌DeepMind等厂商展开直接竞争。

1 天前
微软近期正式上线AI协作工具Copilot Cowork,搭载全新升级的智能研究引擎,可自动扫描用户工作文档、项目材料中的逻辑漏洞、数据缺失及论证空白,目前已向Office 365商业版用户开放灰度测试。据内部测试数据显示,该工具可帮助职场用户减少42%的跨部门信息核对时间,项目前期漏洞排查效率提升近60%。

2 天前
科技巨头微软近期宣布对旗下Azure云平台的AI助手Azure Copilot进行能力升级,新增面向企业应用迁移、存量系统现代化改造的专属工具链。据Gartner 2024年调研数据,当前全球62%的企业存量应用仍未完成云原生改造,该工具可将迁移改造效率提升最多40%,大幅降低企业云转型的技术门槛与成本。

2 天前
2026年3月31日,微软在Windows 11 26300.8142预览版更新中,为任务管理器新增NPU(神经网络处理单元)实时实时功能,用户可直观查看NPU实时占用率、专用内存与共享内存消耗、显卡内置神经网络引擎活动等数据,彻底破解此前NPU运行状态不透明的性能黑盒问题,适配当前AI PC普及的市场需求。

3 天前
2026年3月30日,微软正式接手由数据中心开发商Crusoe开发、原计划由OpenAI扩建的美国得克萨斯州阿比林市大型AI数据中心项目。项目完工后,该算力园区将拥有10栋AI数据中心建筑,配套900兆瓦专属发电厂,整体AI总算力将达到2.1吉瓦,微软与OpenAI将共同入驻同一园区。

4 天前
2026年3月30日,据科技媒体The Information报道,微软近期通知云计算、北美销售团队等核心事业部暂停新员工招聘,通过控制人力成本提升利润率,抵消AI基础设施领域的巨额投入。本次招聘冻结未波及Copilot等关键AI工具开发团队,后者仍正常招聘,是微软资源重点倾斜方向,截至2025年6月微软全球员工总数约22.8万人。