美国科技巨头微软于2026年4月推出三款全新基础大模型,上述产品由微软旗下成立仅6个月的MAI团队研发,覆盖语音转文字、音频生成、图像生成三大核心能力,直指当前多模态AI赛道主流竞品,旨在进一步扩大微软在全球生成式AI市场的话语权,与OpenAI、谷歌DeepMind等厂商展开直接竞争。
2026年以来,全球多模态AI赛道的竞争已经脱离早期通用大模型“堆参数”的粗放式增长阶段,头部厂商纷纷转向覆盖特定场景的轻量化基础模型布局,通过降低调用门槛、提升细分场景性能抢夺客户。此前谷歌DeepMind已推出面向音视频端侧场景的Gemini 2.5 Nano分支,OpenAI也开启了GPT-5语音交互功能的小范围灰度测试,业内普遍认为,多模态交互能力将成为下一代消费级和企业级AI产品的核心入口。
此次微软发布的三款基础大模型,全部由2025年10月才正式组建的MAI团队独立研发,成立仅半年就拿出落地产品,也侧面印证了微软对自研AI技术的投入强度。
三款模型分别覆盖不同的核心场景:语音转写模型支持全球102种语言及方言识别,嘈杂环境下的识别准确率较行业主流产品高出17%,支持实时字幕生成、专业术语自定义词库功能,可直接对接企业客服、线上会议等场景的需求;音频生成模型仅需10秒人声样本即可完成音色复刻,支持8种常见情绪表达,语音拟真度达92%,可应用于有声书制作、智能硬件语音助手等领域;图像生成模型主打低算力消耗,在消费级GPU上即可实现1024*1024分辨率图像的秒级生成,内容合规率较同类产品提升32%,大幅降低中小客户的使用门槛。
作为最早布局生成式AI的科技巨头之一,微软此前凭借Azure云服务+OpenAI产品的组合,已经拿下全球企业级AI服务市场近40%的份额。此次推出自研基础大模型,一方面是为了覆盖OpenAI产品暂未触达的中低端平价场景,完善产品矩阵的覆盖度;另一方面也将逐步降低微软对OpenAI的技术依赖,强化自身在AI产业链中的话语权。
据微软披露,三款模型将于2026年第二季度率先登陆Azure AI Studio面向企业客户开放测试,下半年将逐步接入Office 365 Copilot、必应搜索等微软自有产品矩阵,后续还将开放自定义微调功能,支持客户基于模型开发垂直场景的专属应用。IDC分析师指出,微软此次发布新模型将进一步挤压中小大模型厂商的生存空间,多模态AI赛道的头部集中效应将进一步凸显。

(图像由AI生成)

9 小时前
国际开源Java开发框架Spring正式推出Spring AI专属开发套件,支持开发者沿用Spring原生开发约定,无需额外学习Python栈AI开发技术,即可快速搭建可落地的Java语言AI Agent,据官方测试数据,同复杂度AI Agent的开发周期可缩短62%,目前该工具包已面向全球开发者开放正式版下载。

10 小时前
2026年4月2日,中国广播电视社会组织联合会演员委员会发布严正声明,明确禁止AI换脸、声纹克隆、未经授权抓取演艺数据训练模型等七类AI侵权行为,强调标注“非商用”“个人二创”也不能构成免责依据。此前已有谷江山、边江、季冠霖等近百位配音演员集体抵制AI声音克隆,此次声明标志着演艺行业AI治理进入协同监管新阶段。

11 小时前
2026年4月第三方机构Sensor Tower公布的最新数据显示,快手旗下AI视频创作工具可灵AI2026年3月移动端月活跃用户达780万,远超OpenAI此前关停的Sora峰值470万月活,断层领跑全球移动端AI视频赛道,仅上周其全球周活环比上涨4%至260万,在Sora离场带来的市场真空下,凭借技术优势和低门槛体验快速抢占C端用户市场。

15 小时前
2026年4月2日,知名模特七海Christ公开发声维权,指控短剧《桃花簪》未经授权使用AI换脸技术将其面部移植到剧中反派角色上,相关侵权片段分布在第11至13集,涉及虐待等负面情节,已严重损害其个人名誉与商业价值。目前七海Christ已完成证据保全,要求片方停止侵权、公开道歉并赔偿损失,事件引发行业对AI技术滥用边界的广泛讨论。

16 小时前
2026年4月2日,腾讯QQ宣布正式原生接入开源AI框架OpenClaw(别名“小龙虾”),此次技术整合由腾讯轻量云与QQ团队联合主导,官方内置QQ Bot插件随OpenClaw v2026.3.31版本同步上线,核心代码已并入OpenClaw主仓库。该插件支持私聊、多媒体消息交互及多账号管理,大幅简化AI Bot部署流程,标志着即时通讯与生成式AI生态融合进入新阶段。

18 小时前
微软近期正式上线AI协作工具Copilot Cowork,搭载全新升级的智能研究引擎,可自动扫描用户工作文档、项目材料中的逻辑漏洞、数据缺失及论证空白,目前已向Office 365商业版用户开放灰度测试。据内部测试数据显示,该工具可帮助职场用户减少42%的跨部门信息核对时间,项目前期漏洞排查效率提升近60%。

18 小时前
近日海外科技媒体披露,苹果正计划在iOS 27系统中进一步整合自研AI服务Apple Intelligence能力,重点优化常年被用户吐槽易用性差的快捷指令App,降低自动化操作的配置门槛。当前iOS快捷指令的复杂操作劝退超6成普通用户,本次AI升级有望实现自然语言生成指令、自动适配操作场景等功能,预计2025年6月WWDC大会正式亮相。

1 天前
2026年3月,由前百度副总裁景鲲、技术专家朱凯华联合创立的AI创业项目Genspark宣布完成3.85亿美元B轮扩展融资,投后估值约合人民币110亿元,核心团队规模仅约20人。该公司主打可直接交付成果的“全职Agent”能力,产品性能在GAIA测评中超越Manus等竞品,成功跻身A16Z发布的全球Top50生成式AI应用榜单。