通义千问3.5-Max登LM Arena榜第五国产大模型跻身全球第一梯队

AI创作导航管理员 LV4 资深连续登录7天萌新

3 个月前

风向

261

2026年3月20日，阿里巴巴推出旗舰大模型通义千问3.5-Max-Preview，首次参评第三方权威评测平台LMSYS旗下LM Arena便拿下1464分综合得分，推动阿里通义千问跻身全球大模型厂商排行榜第五位，稳居中国厂商首位，标志着国产大模型正式进入全球第一梯队核心阵营。

在全球大模型评测体系中，LMSYS推出的LM Arena之所以能摆脱“刷分”质疑，核心在于其特殊的评测逻辑：平台会将两款匿名大模型的输出结果同时展示给用户，由用户基于真实体验投票选出更优答案，完全脱离固定考题的应试导向，是目前业内公认参考价值最高的大模型榜单之一。

此次参评的通义千问3.5-Max-Preview是阿里千问家族的最新旗舰产品，首次登上LM Arena便拿下1464分的综合得分，直接将通义千问的厂商排名拉升至全球第五、国内第一的位置。具体分项能力上，该模型的数学推理能力位列全球第五，无风格限制的通用对话绝对胜率排在全球第六，能力均衡性表现突出。

大语言模型人工智能通义千问阿里巴巴 LM Arena

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

通义千问3.5-Max登LM Arena榜第五国产大模型跻身全球第一梯队

最新文章

X社区 · 无限公约

二狗PPT

特朗普政府宣布解除Anthropic两款旗舰AI模型出口管制

OceanBase发布湖库一体AI数据库为AI Agent筑牢核心数据底座

新浪开源VibeThinker-3B，小参数模型比肩百倍规模大模型

AI落地缺标准化训练体系超六成开发团队陷“盲飞”困境

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

通义千问3.5-Max登LM Arena榜第五 国产大模型跻身全球第一梯队

最新文章

X社区 · 无限公约

二狗PPT

特朗普政府宣布解除Anthropic两款旗舰AI模型出口管制

OceanBase发布湖库一体AI数据库 为AI Agent筑牢核心数据底座

新浪开源VibeThinker-3B，小参数模型比肩百倍规模大模型

AI落地缺标准化训练体系 超六成开发团队陷“盲飞”困境

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

通义千问3.5-Max登LM Arena榜第五国产大模型跻身全球第一梯队

OceanBase发布湖库一体AI数据库为AI Agent筑牢核心数据底座

AI落地缺标准化训练体系超六成开发团队陷“盲飞”困境