智谱开源GLM-5.1大模型专业测试反超Claude Opus等头部产品

AI创作导航管理员 LV4 资深连续登录7天萌新

2 个月前

风向

159

2026年4月8日，智谱正式开源旗下新一代大模型GLM-5.1，该产品专为长程任务优化，在专业软件开发基准测试SWE-Bench Pro中拿下58.4分的全球最佳成绩，性能超过已发布的GPT-5.4、Claude Opus 4.6等海外闭源大模型，同时优于MiniMax M2.7、Kimi K2.5等同类开源产品，为AI长程场景落地提供了高性价比的新选项。

SWE-Bench Pro是当前全球公认难度最高的软件开发能力基准测试，其测试样本全部来自GitHub真实Python项目的未解决bug，要求模型在无额外微调的前提下独立完成问题定位与代码修复，得分直接反映大模型的长逻辑链推理和复杂任务处理能力，此前榜单头部位置长期被海外闭源大模型占据。

随着大模型从通用聊天场景向产业端落地，长上下文处理能力已经成为头部厂商的核心竞争方向。不管是动辄几十万字的法律合同审核、全链路代码库迭代，还是长达数小时的音视频内容转写分析，都要求大模型在处理超长文本时不丢失关键信息、逻辑链保持连贯。

大语言模型智谱长上下文大模型开源人工智能 GLM-5.1

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

智谱开源GLM-5.1大模型专业测试反超Claude Opus等头部产品

最新文章

X社区 · 无限公约

二狗PPT

特朗普政府宣布解除Anthropic两款旗舰AI模型出口管制

OceanBase发布湖库一体AI数据库为AI Agent筑牢核心数据底座

新浪开源VibeThinker-3B，小参数模型比肩百倍规模大模型

AI落地缺标准化训练体系超六成开发团队陷“盲飞”困境

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

智谱开源GLM-5.1大模型 专业测试反超Claude Opus等头部产品

最新文章

X社区 · 无限公约

二狗PPT

特朗普政府宣布解除Anthropic两款旗舰AI模型出口管制

OceanBase发布湖库一体AI数据库 为AI Agent筑牢核心数据底座

新浪开源VibeThinker-3B，小参数模型比肩百倍规模大模型

AI落地缺标准化训练体系 超六成开发团队陷“盲飞”困境

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

智谱开源GLM-5.1大模型专业测试反超Claude Opus等头部产品

OceanBase发布湖库一体AI数据库为AI Agent筑牢核心数据底座

AI落地缺标准化训练体系超六成开发团队陷“盲飞”困境