少找工具,多做创作

智谱AI发布GLM-5-Turbo 专为龙虾智能体优化实干型基座模型

2026年3月17日,智谱AI正式发布全新基座模型GLM-5-Turbo,该模型针对开源智能体“龙虾”(OpenClaw)场景深度优化,通过重构训练数据强化四大核心能力,解决通用大模型长链路复杂任务易“失速”痛点,同步推出智能体评测基准ZClawBench,目标推动AI从简单提效工具进化为全天候数字劳动力。

如果说前两年大模型的竞争焦点是参数规模和单轮问答准确率,2026年的行业赛点已经悄然转向了“能不能独立干完一整件事”。不少企业用户都有过类似体验:让AI智能体做一份跨部门的季度经营分析,刚爬到第三个业务系统拉取数据就突然“失忆”,要么重复调用工具,要么直接输出逻辑断裂的结果,这种长链路任务中的“失速”问题,已经成为AI从辅助工具转向核心生产力的最大阻碍。

自2025年开源智能体“龙虾”(OpenClaw)走红以来,全球已有超过百万开发者基于该框架开发各类自动化应用,覆盖办公、研发、电商运营等多个场景。但开发者普遍反馈,通用大模型作为智能体的“大脑”,在处理需要多步骤执行、跨工具调用、长周期运行的任务时,成功率普遍不足40%,很多智能体应用最终只能停留在演示阶段,无法真正投入商用。

针对这一痛点,智谱AI的研发团队没有走堆参数的常规路线,而是基于龙虾智能体的真实工作流重构了全部训练数据,针对性强化了四项核心能力:
稳定工具调用:大幅提升对外部技能包的调用精度,针对高频使用的API、插件等工具的调用错误率降低60%以上,确保任务关键环节不掉链;
复杂指令拆解:可精准识别模糊的自然语言目标,自动拆解为可执行的步骤路径,最高支持20个以上智能体的高效协同作业;
时间维度感知:针对定时触发、跨天运行的长周期任务做了专门优化,即便任务间隔超过72小时也不会丢失上下文,保障执行连贯性;
高吞吐执行:大幅提升长程业务流的并行处理效率,在同时运行100个以上长链路任务的场景下,响应稳定性领跑同类开源基座模型。

与此同时,智谱AI同步推出了业内首个专门面向智能体实战能力的评测基准ZClawBench,覆盖代码开发、数据分析、内容创作、企业服务等多元商用场景,在首轮盲测中,搭载GLM-5-Turbo的龙虾智能体任务完成率比搭载通用基座的版本高出近一倍。

在业内看来,GLM-5-Turbo的发布标志着大模型的研发思路正在从“通用万能”转向“场景专用”:相比动辄上万亿参数、什么都能答但什么都不精的通用大模型,针对具体场景做深度优化的专用基座,反而能更快实现商用落地。

智谱方面表示,此次推出的GLM-5-Turbo将全面开放给龙虾智能体的开发者使用,未来还将针对更多垂直场景的智能体需求推出优化版本,目标在2026年内推动超过10万个可独立执行完整任务的“数字劳动力”上线,覆盖中小企业的行政、研发、运营等多个基础岗位需求。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创