登录体验完整功能(收藏、点赞、评论等) — 已累计有 12526 人加入

通义千问3.5-Max登LM Arena榜第五 国产大模型跻身全球第一梯队

详情页推荐

2026年3月20日,阿里巴巴推出旗舰大模型通义千问3.5-Max-Preview,首次参评第三方权威评测平台LMSYS旗下LM Arena便拿下1464分综合得分,推动阿里通义千问跻身全球大模型厂商排行榜第五位,稳居中国厂商首位,标志着国产大模型正式进入全球第一梯队核心阵营。

在全球大模型评测体系中,LMSYS推出的LM Arena之所以能摆脱“刷分”质疑,核心在于其特殊的评测逻辑:平台会将两款匿名大模型的输出结果同时展示给用户,由用户基于真实体验投票选出更优答案,完全脱离固定考题的应试导向,是目前业内公认参考价值最高的大模型榜单之一。

此次参评的通义千问3.5-Max-Preview是阿里千问家族的最新旗舰产品,首次登上LM Arena便拿下1464分的综合得分,直接将通义千问的厂商排名拉升至全球第五、国内第一的位置。具体分项能力上,该模型的数学推理能力位列全球第五,无风格限制的通用对话绝对胜率排在全球第六,能力均衡性表现突出。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。