2026年3月17日,智谱AI正式发布全新基座模型GLM-5-Turbo,该模型针对开源智能体“龙虾”(OpenClaw)场景深度优化,通过重构训练数据强化四大核心能力,解决通用大模型长链路复杂任务易“失速”痛点,同步推出智能体评测基准ZClawBench,目标推动AI从简单提效工具进化为全天候数字劳动力。
如果说前两年大模型的竞争焦点是参数规模和单轮问答准确率,2026年的行业赛点已经悄然转向了“能不能独立干完一整件事”。不少企业用户都有过类似体验:让AI智能体做一份跨部门的季度经营分析,刚爬到第三个业务系统拉取数据就突然“失忆”,要么重复调用工具,要么直接输出逻辑断裂的结果,这种长链路任务中的“失速”问题,已经成为AI从辅助工具转向核心生产力的最大阻碍。
自2025年开源智能体“龙虾”(OpenClaw)走红以来,全球已有超过百万开发者基于该框架开发各类自动化应用,覆盖办公、研发、电商运营等多个场景。但开发者普遍反馈,通用大模型作为智能体的“大脑”,在处理需要多步骤执行、跨工具调用、长周期运行的任务时,成功率普遍不足40%,很多智能体应用最终只能停留在演示阶段,无法真正投入商用。
针对这一痛点,智谱AI的研发团队没有走堆参数的常规路线,而是基于龙虾智能体的真实工作流重构了全部训练数据,针对性强化了四项核心能力:
稳定工具调用:大幅提升对外部技能包的调用精度,针对高频使用的API、插件等工具的调用错误率降低60%以上,确保任务关键环节不掉链;
复杂指令拆解:可精准识别模糊的自然语言目标,自动拆解为可执行的步骤路径,最高支持20个以上智能体的高效协同作业;
时间维度感知:针对定时触发、跨天运行的长周期任务做了专门优化,即便任务间隔超过72小时也不会丢失上下文,保障执行连贯性;
高吞吐执行:大幅提升长程业务流的并行处理效率,在同时运行100个以上长链路任务的场景下,响应稳定性领跑同类开源基座模型。
与此同时,智谱AI同步推出了业内首个专门面向智能体实战能力的评测基准ZClawBench,覆盖代码开发、数据分析、内容创作、企业服务等多元商用场景,在首轮盲测中,搭载GLM-5-Turbo的龙虾智能体任务完成率比搭载通用基座的版本高出近一倍。
在业内看来,GLM-5-Turbo的发布标志着大模型的研发思路正在从“通用万能”转向“场景专用”:相比动辄上万亿参数、什么都能答但什么都不精的通用大模型,针对具体场景做深度优化的专用基座,反而能更快实现商用落地。
智谱方面表示,此次推出的GLM-5-Turbo将全面开放给龙虾智能体的开发者使用,未来还将针对更多垂直场景的智能体需求推出优化版本,目标在2026年内推动超过10万个可独立执行完整任务的“数字劳动力”上线,覆盖中小企业的行政、研发、运营等多个基础岗位需求。

29 分钟前
2026年4月,联想正式对外展示旗下轻量化AI工具天禧AI Claw,实测数据显示该产品可实现最快1小时完成企业业务场景适配,相比行业平均70%中小企业部署AI需10人天以上的配置周期,效率提升超90%,解决了过往AI工具部署复杂、定制成本高、落地效果不达预期的行业普遍痛点。

32 分钟前
4月2日消息,消费级AR眼镜头部厂商XREAL于日前正式向港交所递交招股书,冲刺港股AI眼镜第一股。该公司由前英伟达员工、浙江大学校友徐弛联合创办,获得雷军旗下投资机构注资,2023年全年实现营收5.16亿元,净亏损4.56亿元,是目前国内消费级AR眼镜赛道出货量位居前列的核心玩家。

2 小时前
4月2日火山引擎于AI创新巡展·武汉站正式宣布Seedance 2.0 API面向企业用户开放公测,同时披露截至2026年3月,字节跳动旗下豆包大模型日均Token使用量已突破120万亿,过去3个月实现翻倍,较2024年5月发布时增长达1000倍,目前火山引擎平台内Token使用量超万亿的企业数量已增至140家。

2 小时前
2026年4月,全球AI二级交易市场出现明显分化:曾经一券难求的OpenAI现有6亿美元待售股权无人接盘,其直接竞争对手、主打Claude系列大模型的Anthropic却获得资本市场热捧,买方市场已积压约20亿美元资金等待入场。这一估值倒挂现象,折射出通用人工智能赛道的投资逻辑正在发生深层转向。

2 小时前
2026年4月2日,AI搜索初创公司Perplexity AI在美国旧金山联邦法院遭遇集体诉讼,被指控未经用户许可,即便用户开启专属隐身模式,仍通过内置追踪器向Meta、Google共享包含财务、税务信息在内的敏感聊天内容。目前Perplexity发言人杰西·德怀尔称尚未收到正式诉讼文件,Meta称其政策严禁广告商提交敏感数据,谷歌暂未作出回应。

2 小时前
2026年4月2日,火山引擎总裁谭待正式披露字节跳动旗下豆包大模型最新运营数据:其日均Token使用量已突破120万亿大关,近三个月用量实现翻倍,较两年前增长超1000倍,刷新国内大模型用量纪录。这一数据也印证国内AI产业已从模型研发竞赛转向规模化应用阶段,国产大模型调用量已在部分领域反超海外主流产品。

2 小时前
2026年4月,谷歌旗下视频平台YouTube遭200余名儿童发展专家及教育机构联名公开信抵制。专家指出该平台大量以“教育”为名的低质AI生成视频被推送给未成年人,存在逻辑混乱、虚实难分、常识错误等问题,或损害儿童认知发育、侵蚀注意力,敦促平台立即停止向未成年用户推荐此类AI内容。

3 小时前
2026年4月2日,Anthropic旗下AI编码工具Claude Code正式推出全新终端渲染方案NO_FLICKER模式,用户仅需配置一行环境变量即可启用。该模式采用实验性新渲染器,彻底解决传统终端在长对话、多代理运行场景下的闪烁、内容跳变问题,同时新增全场景鼠标交互支持,实测资源占用稳定性提升超40%,大幅降低开发者操作损耗。