登录体验完整功能(收藏、点赞、评论等) —

智谱发布GLM-5.1开源大模型 长程能力首超Opus4.6支持8小时连续工作

2026年4月10日,智谱正式发布并开源新一代旗舰大模型GLM-5.1。该模型是全球首个支持8小时连续自主工作的开源大模型,在SWE-bench Pro基准测试中长程任务能力首次超越海外顶尖模型Opus 4.6,海量数据检索编程场景实测性能达此前行业最优水平的6倍,标志大模型应用从“一问一答”迈入“自主办公”新阶段。

在4月10日的技术发布会上,智谱团队现场公开了GLM-5.1的实测案例:针对一套企业级海量数据检索系统的重构需求,模型自主完成需求拆解、代码编写、调试优化全流程,累计执行6000余次操作后,最终交付的系统运行速度达到行业此前最优方案的6倍,全程无人工干预耗时仅7小时42分。

过去三年大模型的竞争主要聚焦在上下文窗口长度、通用问答准确率等指标,但这类参数提升只能解决“单次应答质量”问题,面对需要数十步甚至上千步操作的长周期复杂任务,主流模型普遍存在逻辑断层、遗忘前置需求、出错率随任务时长指数上升等问题,无法独立交付可用成果。
此前全球范围内不管是闭源还是开源大模型,无人工干预的连续工作时长上限普遍不超过4小时,只能作为辅助工具嵌入工作流,无法独立承担完整任务,这也成为大模型进入企业级核心生产场景的最大瓶颈。

!
信息及评测声明: 本文部分信息整理自互联网公开资料,并包含由 AI创作导航 团队独立进行的实测体验。我们力求内容客观准确,但因工具功能、价格及政策可能存在实时调整,所有信息仅供参考,请务必在使用前访问官网确认。文中观点不构成任何决策建议,读者需自行评估和承担使用风险。如发现内容有误或侵权,欢迎随时反馈,我们将及时核实处理。
相关资讯
AI小创