国内AI厂商Z.ai近期正式推出开源大模型GLM-5.1,该模型支持AI编码智能体实现连续数小时的无干预自主运行,可完成数百次迭代优化,大幅提升长周期软件开发任务的处理效率。当前全球AI企业正加速布局编码智能体赛道,这款新模型的落地将为开发工具市场提供新的技术参照,也为开源大模型的工业级应用拓展了边界。
如果说此前AI编码工具还停留在“单次问答补全代码”的辅助阶段,GLM-5.1的出现正在打破这一能力边界。
---
长期以来,AI编码工具的能力边界始终卡在“短任务辅助”层面:不管是代码补全还是单轮bug排查,都只能解决颗粒度极小的开发需求,一旦遇到需要跨文件调试、多模块逻辑对齐、多轮验证的长周期开发任务,传统大模型很容易出现上下文丢失、逻辑漂移的问题,需要开发者反复介入校正,实际效率提升十分有限。
这种痛点也让编码智能体的长周期运行能力,成为近两年AI大厂的竞速赛道:据相关行业调研数据,国内企业级开发市场对自动化编码工具的需求年增速超过120%,能够覆盖全链路开发流程的智能体产品,已经成为科技企业技术投入的核心方向之一。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
近日微软正式推出开源Agent Governance Toolkit(代理治理工具包),该产品直接对标OWASP评选的十大Agentic AI安全威胁,可在运行阶段遏制提示词注入、AI代理失控、工具权限滥用等常见安全问题,为企业级AI代理应用落地提供了新的安全合规解决方案,填补了智能代理运行态治理的市场空白。

2 小时前
2026年4月8日,由中国科学院上海高等研究院牵头打造的全球首个全景式碳排放核算系统“磐石·禹衡”碳核算大模型正式在上海发布。该模型通过数据、算法、算力三位一体架构,搭载208TB自主碳数据集、320亿参数大模型底座及5个专项智能体,破解传统碳核算行业长期存在的多重痛点,实现该领域从跟跑到范式重构的技术跨越。

2 小时前
2026年4月开放数据研究所(ODI)发布的最新研究显示,英国政府2024年秋季预算案确认、投资1亿英镑的国家数据图书馆(NDL)计划,正遭遇公共数据集质量不足的核心挑战。该计划原本预期为AI研发、企业创新提供权威数据支撑,当前却因数据集误导性标题、元数据缺失、标签混乱等问题,落地进程存在较大不确定性。

5 小时前
2026年4月6日,微软GitHub为旗下Copilot CLI推出名为Rubber Duck的跨模型AI代码审查实验性功能,通过引入“第二意见”独立审查机制,支持用户选用Claude系列作为主控模型、GPT-5.4做代码校验,可解决传统AI自我审查的训练偏差问题,经测试AI代码生成性能提升近75%,有效降低开发过程中早期错误累积风险。

5 小时前
2026年4月8日,Google正式宣布将旗下生成式AI大模型Gemini深度集成至Gmail邮箱服务,针对外界对AI处理敏感隐私数据的普遍质疑,Gmail产品副总裁Blake Barnes代表官方作出三项核心隐私承诺,明确Gemini等基础大模型不会使用用户个人邮件内容训练,所有AI处理环节实现数据隔离、权限自动销毁。

6 小时前
2026年4月8日,智谱正式开源旗下新一代大模型GLM-5.1,该产品专为长程任务优化,在专业软件开发基准测试SWE-Bench Pro中拿下58.4分的全球最佳成绩,性能超过已发布的GPT-5.4、Claude Opus 4.6等海外闭源大模型,同时优于MiniMax M2.7、Kimi K2.5等同类开源产品,为AI长程场景落地提供了高性价比的新选项。

6 小时前
2026年4月8日,腾讯正式发布国内首款AI驱动浏览器产品“龙虾QBotClaw”,该产品是国内首个支持主流大模型API自由配置的AI浏览器,打破行业普遍的单一模型绑定规则,内置X5use高精度识别技术,可执行跨页面复杂任务,目前Mac版已上线并集成QQ浏览器Skill,Windows版将于近期推出,核心目标是降低大模型使用门槛。

8 小时前
2026年4月,英特尔正式宣布加入埃隆·马斯克旗下Terafab AI芯片项目,与SpaceX、特斯拉、xAI达成四方战略合作,共同推进全球规模领先的半导体制造计划。该项目核心目标为实现每年1太瓦算力产出,集逻辑芯片、存储、先进封装于一体,为下一代AI模型、人形机器人及太空AI系统提供底层算力支撑。