智谱开源GLM-5：大模型从代码生成迈向工程构建时代

2 小时前 AI快讯 1

2026年2月12日，智谱正式发布并开源全新基座模型GLM-5，这一产品推动大模型能力实现关键范式转移——从单一的代码片段生成，升级至可独立完成复杂系统工程与长程任务的“Agentic Engineering”阶段。该模型在全球权威Artificial Analysis榜单中位列全球第四、开源模型第一，核心性能对标行业顶尖水平，使用体验已逼近Claude Opus4.5。

在大模型技术迭代的赛道上，“代码能力”曾是衡量模型实用性的核心指标之一，但随着AI应用向产业深度渗透，市场对模型的需求早已超越“写代码”本身。企业需要的是能理解复杂工程需求、自主规划开发流程、完成从架构设计到调试部署全链路任务的AI助手，而GLM-5的出现，正是对准这一需求的突破性答案。

据最新发布的Artificial Analysis全球大模型权威榜单显示，GLM-5凭借综合性能跻身全球第四位，更在开源模型阵营中拿下头名。这一排名不仅是对其技术实力的权威认可，也打破了此前闭源模型在高端性能领域的垄断态势，证明开源模型同样能达到行业顶尖水准。

GLM-5的核心优势集中在卓越的工程化落地能力上。在衡量软件工程师实际任务完成度的SWE-bench-Verified基准测试中，它取得了77.8分的开源最佳成绩——这意味着模型能准确理解并解决真实软件开发场景中的复杂问题，包括bug修复、功能迭代、系统兼容调试等；而在针对终端环境复杂操作的Terminal Bench2.0测试中，GLM-5以56.2分再次拿下开源SOTA，甚至超越了谷歌的Gemini 3 Pro。这些数据背后，是模型在代码逻辑、系统架构、工具调用等多维度能力的全面提升。

除了硬核编程能力，GLM-5的长程Agent能力同样亮眼。在BrowseComp（网页信息检索与任务执行）、MCP-Atlas（多模态复杂任务规划）以及τ²-Bench（复杂工具链规划测试）等多项长程任务基准中，GLM-5稳居开源模型第一梯队。这意味着它不再局限于短平快的即时任务，而是能独立完成跨天数、多步骤的复杂工程：从用户提出“搭建一个支持多用户的电商后台”需求出发，GLM-5可以自主调研技术方案、设计数据库架构、编写前后端代码、配置服务器环境，最终交付一个可直接运行的完整系统。

作为一款开源基座模型，GLM-5的开放释放将为AI产业生态带来新的活力。开发者无需依赖闭源模型的高昂调用成本，就能基于GLM-5搭建定制化的工程Agent、企业级AI助手，加速AI在软件开发、系统运维、自动化办公等领域的落地。这种开源模式也将吸引更多技术力量参与模型优化，推动整个大模型技术向更实用化、工程化的方向发展。

从代码生成到工程构建，GLM-5的发布标志着大模型正式进入“Agentic Ready”的全新阶段。未来，随着这类具备自主工程化能力的模型普及，AI将不再是人类的“辅助工具”，而是能独当一面的“协作工程师”，甚至可能重构软件开发、系统构建等领域的工作流程，为产业数字化转型注入新的动力。