美国科技巨头微软于2026年4月推出三款全新基础大模型,上述产品由微软旗下成立仅6个月的MAI团队研发,覆盖语音转文字、音频生成、图像生成三大核心能力,直指当前多模态AI赛道主流竞品,旨在进一步扩大微软在全球生成式AI市场的话语权,与OpenAI、谷歌DeepMind等厂商展开直接竞争。
2026年以来,全球多模态AI赛道的竞争已经脱离早期通用大模型“堆参数”的粗放式增长阶段,头部厂商纷纷转向覆盖特定场景的轻量化基础模型布局,通过降低调用门槛、提升细分场景性能抢夺客户。此前谷歌DeepMind已推出面向音视频端侧场景的Gemini 2.5 Nano分支,OpenAI也开启了GPT-5语音交互功能的小范围灰度测试,业内普遍认为,多模态交互能力将成为下一代消费级和企业级AI产品的核心入口。
此次微软发布的三款基础大模型,全部由2025年10月才正式组建的MAI团队独立研发,成立仅半年就拿出落地产品,也侧面印证了微软对自研AI技术的投入强度。
三款模型分别覆盖不同的核心场景:语音转写模型支持全球102种语言及方言识别,嘈杂环境下的识别准确率较行业主流产品高出17%,支持实时字幕生成、专业术语自定义词库功能,可直接对接企业客服、线上会议等场景的需求;音频生成模型仅需10秒人声样本即可完成音色复刻,支持8种常见情绪表达,语音拟真度达92%,可应用于有声书制作、智能硬件语音助手等领域;图像生成模型主打低算力消耗,在消费级GPU上即可实现1024*1024分辨率图像的秒级生成,内容合规率较同类产品提升32%,大幅降低中小客户的使用门槛。
作为最早布局生成式AI的科技巨头之一,微软此前凭借Azure云服务+OpenAI产品的组合,已经拿下全球企业级AI服务市场近40%的份额。此次推出自研基础大模型,一方面是为了覆盖OpenAI产品暂未触达的中低端平价场景,完善产品矩阵的覆盖度;另一方面也将逐步降低微软对OpenAI的技术依赖,强化自身在AI产业链中的话语权。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 天前
2026年4月17日,AI大模型厂商Anthropic正式推出旗下实验室新产品Claude Design,该工具基于其最新旗舰视觉模型Claude Opus 4.7打造,支持用户与Claude协作完成设计、原型、幻灯片、单页宣传物料等专业视觉产出,目前已向Claude Pro、Max、团队及企业级用户开放研究预览资格,标志着大模型能力边界向视觉创作场景进一步延伸。

2 天前
OpenAI最新披露数据显示,旗下生成式AI工具ChatGPT用户性别结构出现历史性逆转:2022年发布之初女性用户占比仅20%,当前已反超男性突破50%,对应约5亿女性定期使用,总用户规模逼近10亿。同时其可用算力从2023年的0.2吉瓦升至2025年的1.9吉瓦,已联合英伟达等厂商锁定2030年30吉瓦算力目标。

2 天前
近日,全球电商巨头亚马逊正式上线AI智能硬件专属店面,集中覆盖搭载生成式AI功能的智能家居、可穿戴设备、个人办公终端等多个品类。据亚马逊用户行为数据显示,2024年上半年平台AI硬件搜索量同比提升217%,此次专属店上线正是为匹配用户爆发式增长的AI消费需求,进一步抢占消费级AI终端赛道的市场份额。

2 天前
近日谷歌推出Gemini大模型的全新个性化生图功能,该功能可在获得用户主动授权后访问谷歌相册中的历史照片,分析用户的构图、色彩、风格等审美偏好,生成符合用户个人品味的定制化图片。内部测试数据显示,该功能生成图片符合用户预期的比例较通用生图模式提升62%,目前已向所有Gemini高级订阅用户开放使用。

2 天前
谷歌近日面向Chrome浏览器推送AI模式重大版本更新,内置Google Gemini能力将支持用户在当前页面直接完成信息检索、内容摘要、格式转换等操作,据内部测试数据显示,该功能可帮助用户减少约40%的跨标签跳转次数,单次信息查询平均耗时缩短27%,是生成式AI在大众工具场景落地的重要进展。

2 天前
2026年4月披露的信息显示,AI初创公司Thinking Machines资深工程师Joshua Gross已正式加入Meta超级智能实验室并领导工程团队。Gross此前主导开发了该公司旗舰多模态创意生成工具Tinker,截至目前Meta已从该公司挖走5名创始成员,OpenAI也挖走其2名核心高管,硅谷AI领域头部企业与创企间的人才争夺正持续升温。

2 天前
2026年4月,青海省循化县一名男子因家庭矛盾,利用AI图像生成技术伪造自己身处黄河的轻生照片发送给妻子,致其恐慌报警。当地警方启动应急预案沿黄河岸展开全面搜救后未发现相关人员踪迹,经查确认照片为AI生成,涉事男子已承认行为,该事件也引发公众对生成式AI滥用边界、公共资源浪费等问题的讨论。

2 天前
2026年4月16日,AI大模型企业Anthropic深夜发布新一代旗舰大模型Claude Opus 4.7。相较前代产品Opus 4.6,该模型在复杂软件工程任务、高分辨率图像处理、超长任务处理及自主校验能力上均有显著提升,其中高分辨率图像处理能力达此前Claude系列模型的3倍以上,配套的Claude Code工具也同步完成迭代。