登录体验完整功能(收藏、点赞、评论等)

通义千问3.5旗舰预览版登LM Arena全球第五 居国内首位

2026年3月20日,阿里云旗下千问大模型家族发布旗舰预览版Qwen3.5-Max-Preview,在全球权威大模型评测平台LMSYS运营的LM Arena中拿下1464分综合得分,位列总榜全球第五、国内大模型首位,其数学能力跻身全球第五,文本处理能力达到专家级,是目前中国大模型在国际盲测中取得的最好成绩。

LM Arena的排名含金量之所以受到全球AI产业认可,核心在于其采用的匿名盲测规则:所有参与评测的模型都会隐去品牌标识,由测试者基于实际体验进行两两对比打分,完全排除品牌认知、宣传营销等非技术因素的干扰,其结果更能反映大模型的真实技术实力。此前全球榜单前五位长期被OpenAI、谷歌DeepMind、Anthropic等海外厂商的产品占据,国产大模型首次跻身前五也被业内视为标志性事件。

此次上榜的Qwen3.5-Max-Preview是阿里千问3.5系列的旗舰预览版本,最终拿下的1464分综合得分不仅创下国产大模型在该评测中的历史最高纪录,也拉开了和其他国内大模型的技术差距。

分项能力榜单显示,该模型的数学推理能力位列全球第五,专家级文本处理能力排名全球第十;在排除风格偏好、回答长度等软因素的绝对性能比拼中,其整体胜率位居全球第六,综合表现已经追上海外第一梯队大模型的平均水平。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创