登录体验完整功能(收藏、点赞、评论等) — 已累计有 12522 人加入

通义千问3.5旗舰预览版登LM Arena全球第五 居国内首位

详情页推荐

2026年3月20日,阿里云旗下千问大模型家族发布旗舰预览版Qwen3.5-Max-Preview,在全球权威大模型评测平台LMSYS运营的LM Arena中拿下1464分综合得分,位列总榜全球第五、国内大模型首位,其数学能力跻身全球第五,文本处理能力达到专家级,是目前中国大模型在国际盲测中取得的最好成绩。

LM Arena的排名含金量之所以受到全球AI产业认可,核心在于其采用的匿名盲测规则:所有参与评测的模型都会隐去品牌标识,由测试者基于实际体验进行两两对比打分,完全排除品牌认知、宣传营销等非技术因素的干扰,其结果更能反映大模型的真实技术实力。此前全球榜单前五位长期被OpenAI、谷歌DeepMind、Anthropic等海外厂商的产品占据,国产大模型首次跻身前五也被业内视为标志性事件。

此次上榜的Qwen3.5-Max-Preview是阿里千问3.5系列的旗舰预览版本,最终拿下的1464分综合得分不仅创下国产大模型在该评测中的历史最高纪录,也拉开了和其他国内大模型的技术差距。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。