2026年3月20日,阿里云旗下千问大模型家族发布旗舰预览版Qwen3.5-Max-Preview,在全球权威大模型评测平台LMSYS运营的LM Arena中拿下1464分综合得分,位列总榜全球第五、国内大模型首位,其数学能力跻身全球第五,文本处理能力达到专家级,是目前中国大模型在国际盲测中取得的最好成绩。
LM Arena的排名含金量之所以受到全球AI产业认可,核心在于其采用的匿名盲测规则:所有参与评测的模型都会隐去品牌标识,由测试者基于实际体验进行两两对比打分,完全排除品牌认知、宣传营销等非技术因素的干扰,其结果更能反映大模型的真实技术实力。此前全球榜单前五位长期被OpenAI、谷歌DeepMind、Anthropic等海外厂商的产品占据,国产大模型首次跻身前五也被业内视为标志性事件。
此次上榜的Qwen3.5-Max-Preview是阿里千问3.5系列的旗舰预览版本,最终拿下的1464分综合得分不仅创下国产大模型在该评测中的历史最高纪录,也拉开了和其他国内大模型的技术差距。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录