少找工具,多做创作

微软发布第二代生图模型MAI-Image-2 性能跻身全球前三梯队

2026年3月20日,微软AI首席执行官穆斯塔法·苏莱曼正式推出第二代图像生成模型MAI-Image-2。该模型在权威生图评测榜单LMArena中位列全球第三,仅次于谷歌Gemini-3.1-flash-image-preview与OpenAI GPT-image-1.5-high-fidelity,较2025年10月发布的初代模型(初始排名第九)实现了性能跃升,还攻克了行业长期存在的文字渲染乱码痛点。


作为全球认可度最高的AI生图评测体系,LMArena一直被业内称为生图领域的“最高竞技场”,排名权重涵盖画质还原、指令遵循、特殊场景生成能力等12个核心维度,参考性远高于普通用户测评。在过去两年时间里,该榜单的TOP2位置始终被谷歌和OpenAI牢牢占据,没有第三家厂商能挤进第一梯队,行业甚至一度出现“生图赛道不会有第三玩家”的判断。

微软2025年才正式下场布局C端生图赛道,初代MAI-Image发布时仅排在LMArena榜单第九位,彼时多数分析师认为微软至少需要3年才能追赶上第一梯队的技术差距,而此次MAI-Image-2直接跳级到第三位,仅用了5个月就完成了技术赶超,彻底打破了两强垄断的市场格局。

MAI-Image-2的性能提升并非单点优化,而是全链路的技术迭代。首先是核心画质指标的大幅升级,不管是自然光的明暗层次、透明物体的折射效果,还是不同材质的纹理细节,该模型的表现和榜单前两名的差距已经缩小到5%以内,在用户盲测中,有37%的参与者无法区分MAI-Image-2生成的照片和真实拍摄的素材。

最受行业关注的是,该模型彻底解决了困扰AI生图领域多年的“文字乱码”痛点。过往几乎所有生图模型生成带文字的内容时,都会出现文字变形、乱码、错字等问题,而MAI-Image-2的文字渲染准确率达到了100%,不管是信息图表里的小字号标注、演示文稿的标题,还是复杂逻辑流程图的内容,都能做到清晰准确无误差,这一表现甚至超过了目前排名第二的OpenAI GPT-image-1.5-high-fidelity,后者的文字渲染准确率仅为82%。

此外,相比初代模型,MAI-Image-2的生成速度还提升了40%,单张4K分辨率图像的生成时间从12秒压缩到7秒,大幅降低了商用场景的等待成本。

穆斯塔法·苏莱曼在发布会上透露,MAI-Image-2将在未来一个月内逐步接入微软365办公套件、Bing搜索以及Copilot全生态,普通用户不需要额外付费,就能在制作Office演示文稿、生成信息图、搜索素材时直接调用该模型的能力。

行业分析师认为,微软此次的技术突破,将把AI生图的竞争从“跑分比画质”的单一维度,拉到“生态落地”的综合竞争赛道。凭借微软在办公场景的全球垄断地位,MAI-Image-2很可能在商用生图市场实现对谷歌、OpenAI的反超,预计2026年下半年,头部厂商都会加速生图技术在垂直场景的落地,用户的使用成本也会进一步下降。


!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创