智谱开源GLM-5:大模型从代码生成迈向工程构建时代

2 小时前 AI快讯 1

智谱开源GLM-5:大模型从代码生成迈向工程构建时代

2026年2月12日,智谱正式发布并开源全新基座模型GLM-5,这一产品推动大模型能力实现关键范式转移——从单一的代码片段生成,升级至可独立完成复杂系统工程与长程任务的“Agentic Engineering”阶段。该模型在全球权威Artificial Analysis榜单中位列全球第四、开源模型第一,核心性能对标行业顶尖水平,使用体验已逼近Claude Opus4.5。

在大模型技术迭代的赛道上,“代码能力”曾是衡量模型实用性的核心指标之一,但随着AI应用向产业深度渗透,市场对模型的需求早已超越“写代码”本身。企业需要的是能理解复杂工程需求、自主规划开发流程、完成从架构设计到调试部署全链路任务的AI助手,而GLM-5的出现,正是对准这一需求的突破性答案。

据最新发布的Artificial Analysis全球大模型权威榜单显示,GLM-5凭借综合性能跻身全球第四位,更在开源模型阵营中拿下头名。这一排名不仅是对其技术实力的权威认可,也打破了此前闭源模型在高端性能领域的垄断态势,证明开源模型同样能达到行业顶尖水准。

GLM-5的核心优势集中在卓越的工程化落地能力上。在衡量软件工程师实际任务完成度的SWE-bench-Verified基准测试中,它取得了77.8分的开源最佳成绩——这意味着模型能准确理解并解决真实软件开发场景中的复杂问题,包括bug修复、功能迭代、系统兼容调试等;而在针对终端环境复杂操作的Terminal Bench2.0测试中,GLM-5以56.2分再次拿下开源SOTA,甚至超越了谷歌的Gemini 3 Pro。这些数据背后,是模型在代码逻辑、系统架构、工具调用等多维度能力的全面提升。

除了硬核编程能力,GLM-5的长程Agent能力同样亮眼。在BrowseComp(网页信息检索与任务执行)、MCP-Atlas(多模态复杂任务规划)以及τ²-Bench(复杂工具链规划测试)等多项长程任务基准中,GLM-5稳居开源模型第一梯队。这意味着它不再局限于短平快的即时任务,而是能独立完成跨天数、多步骤的复杂工程:从用户提出“搭建一个支持多用户的电商后台”需求出发,GLM-5可以自主调研技术方案、设计数据库架构、编写前后端代码、配置服务器环境,最终交付一个可直接运行的完整系统。

作为一款开源基座模型,GLM-5的开放释放将为AI产业生态带来新的活力。开发者无需依赖闭源模型的高昂调用成本,就能基于GLM-5搭建定制化的工程Agent、企业级AI助手,加速AI在软件开发、系统运维、自动化办公等领域的落地。这种开源模式也将吸引更多技术力量参与模型优化,推动整个大模型技术向更实用化、工程化的方向发展。

从代码生成到工程构建,GLM-5的发布标志着大模型正式进入“Agentic Ready”的全新阶段。未来,随着这类具备自主工程化能力的模型普及,AI将不再是人类的“辅助工具”,而是能独当一面的“协作工程师”,甚至可能重构软件开发、系统构建等领域的工作流程,为产业数字化转型注入新的动力。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创