登录体验完整功能（收藏、点赞、评论等） — 已累计有 9087 人加入

阿里通义千问首发Qwen3.7旗舰预览版基准测试冲入全球第十三

AI创作导航 1 小时前

风向

7

收藏

2026年5月19日，阿里云旗下通义千问大模型正式发布新一代旗舰预览版Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview，目前已上线大模型竞技场Arena AI及官方Qwen Chat。两款模型现阶段仅开放思考模式，主打高难度逻辑推理与深度计算，其中Qwen3.7 Max在通用基准测试中位列全球第13，推动通义千问实验室排名跻身全球前六，正式版将在后续阿里云峰会发布。

5月19日早间，全球大模型性能评测平台Arena AI的实时榜单突然更新两个全新测试条目：阿里通义千问旗下的Qwen3.7两款旗舰预览版直接冲入上游梯队，上线仅2小时就收获了超过3000次用户盲测投票，在推理类问题上的正确率远超同梯队其他模型，很快引发了全球大模型从业者的关注。

和此前通义千问发布的所有版本不同，此次上线的两款预览版仅支持“思考模式”，暂时屏蔽了网页搜索、代码解释器等所有外围辅助工具，用户只能调用模型的原生能力解决问题。

据了解，这一设置是为了最大化还原大模型本身的逻辑推理、深度计算能力，避免工具加成干扰性能评测结果，定向针对高难度数理推演、多步逻辑问题、复杂专业任务求解等场景做测试优化。

目前公开的测试数据显示，Qwen3.7-Max-Preview的纯原生能力综合得分在全球所有公开测试的大模型中位列第13位，这一成绩直接推动通义千问团队的整体实验室排名冲入全球前六，是当前中文大模型厂商在纯推理基准上拿到的最好成绩之一。

大语言模型逻辑推理阿里云通义千问 Qwen3.7

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

相关网站

提示工程指南

提示工程领域专业学习平台

讯飞星火

多能力AI智能助手

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

SkyGen Plus

一站式多模态AI音视图创作平台

HitPublish

AI WordPress内容批

Gemini Omni

AI视频生成编辑智能工具

Omni AI Video

多模态AI视频生成编辑工具

相关资讯

© 2026 AI创作导航. All Rights Reserved.

滇ICP备2026002425号-1 公安备案图标

公安备案图标

滇公网安备 53252802528133号