2026年3月20日,权威大模型盲测榜单LMArena公布最新排名,阿里巴巴旗下千问系列旗舰预览版Qwen3.5-Max-Preview以1464分刷新国产大模型历史得分纪录,多项能力维度超越GPT5.4、Claude4.5及Grok4.1等海外顶尖模型登顶。同期发布的全球大模型企业综合实力榜中,中国企业占据前十中的五席,标志着国产大模型正式跻身全球第一梯队。
作为业内公认最具公信力的大模型评测体系,LMArena的所有参评模型都会被隐去品牌标识,由评测团队从12个核心维度交叉打分,最终得分完全不受品牌光环影响,素来被视为全球大模型通用能力的“试金石”。此前该榜单榜首位置长期被OpenAI、Anthropic等海外厂商把持,国产模型的最好成绩仅为第四名。
本次Qwen3.5-Max-Preview拿下的1464分,不仅较此前国产模型的最高得分提升近12%,更在逻辑推理、长文本处理等核心维度实现对海外头部产品的全面反超。在同期参评的国产模型中,Qwen3.5的得分也显著领先豆包2.0、GLM5、Kimi2.5等产品,成为首个拿下全球盲测榜首的国产大模型。
这一成绩直接打破了海外厂商对大模型性能天花板的垄断,也证明中国自研大模型的通用能力已经达到全球顶尖水平,不再是跟随者角色。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录