2026年4月8日志谱AI发布新一代开源大模型GLM-5.1,该模型实现长程执行与代码能力双重突破,可支持最长8小时独立复杂任务处理,在SWE-Bench Pro基准测试中修复高难度工程Bug的表现超越GPT-5.4、Claude Opus4.6等国际顶级模型,单次任务可执行超1200步操作,输出成果等同于4名资深开发一周工作量。
不少开发者社群最近流传的一段AI作业录屏引发热议:没有人工干预的情况下,一款大模型花8小时完成了完整Linux桌面系统的编译、配置与功能测试,全程执行了1200多步操作,中途没有出现一次任务中断的情况。这款模型就是刚正式推出的GLM-5.1。
此前无论是开源还是闭源大模型,大多只能支撑最多几分钟到几十分钟的短周期任务,一旦涉及多步骤、长周期的复杂工程任务,很容易出现记忆偏差、逻辑断裂的问题。GLM-5.1的核心升级就是解决了这一痛点,**最长可支持8小时连续独立作业**,在搭建Linux桌面的测试中,仅用20分钟就输出了可用的初步版本,最终交付的成品功能完整度相当于**4名资深后端开发一周的工作量**,生产力属性远超此前所有同类产品。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
48 分钟前
2026年4月,英特尔正式宣布加入埃隆·马斯克旗下Terafab AI芯片项目,与SpaceX、特斯拉、xAI达成四方战略合作,共同推进全球规模领先的半导体制造计划。该项目核心目标为实现每年1太瓦算力产出,集逻辑芯片、存储、先进封装于一体,为下一代AI模型、人形机器人及太空AI系统提供底层算力支撑。

1 小时前
2026年4月8日智谱正式发布新一代大模型GLM-5.1,据模型聚合平台OpenRouter监测,GLM系列模型单价同步上调10%,调价后编程场景价格对标Anthropic旗下Claude3.5 Sonnet。该模型在SWE-bench Pro基准测试中超越Claude4.6 Opus登顶,支持单次8小时长时自主作业,此次调价也是国产大模型首次在主流场景与全球头部厂商价格对齐。

1 小时前
2026年4月,被业内称为“GPT-4o之母”的OpenAI核心高管Joanne Jang正式宣布离职,结束四年半任职生涯。作为主导ChatGPT交互感、情绪表达能力优化的核心负责人,Joanne Jang是GPT-4o模型落地的关键推手,其无理由静默离职已引发业内对OpenAI管理层稳定性、后续IPO推进节奏的广泛讨论。

2 小时前
2026年4月8日,工业和信息化部联合其余九个部门正式印发《人工智能科技伦理审查与服务办法(试行)》,该办法明确了AI科技伦理审查的适用范围、实施主体与全流程工作程序,同时从标准建设等五大维度提出支持措施,为国内AI产业合规、安全发展提供可落地的伦理治理指引,填补了此前细分操作层面的规则空白。

2 小时前
近日AI大模型研发商Anthropic宣布切断OpenClaw等多个第三方框架的Claude订阅服务调用通道,官方披露部分重度用户仅支付200美元订阅费却消耗了价值5000美元的算力资源,给企业带来严重财务压力。小米MiMo大模型负责人罗福莉公开指出第三方框架上下文管理效率低下的核心问题,同时警示行业盲目开展Token价格战将面临极高财务风险。

2 小时前
2026年4月,谷歌母公司Alphabet宣布为旗下AI助手Gemini新增心理健康支持功能,可智能识别用户对话中的自残、自杀倾向并弹出救助入口。同时Alphabet承诺未来3年投入3000万美元,用于支持全球危机热线扩容服务能力,相关功能均经临床专家参与研发,保障干预流程的专业性与安全性。

3 小时前
2026年4月谷歌宣布旗下Google Maps应用搭载自研多模态大模型Gemini,推出AI自动生成配图说明功能。用户上传地点相关照片、视频时,系统可自动分析画面内容生成适配的描述文案,支持用户自定义修改。目前该功能已率先登陆美国市场iOS端英文环境,后续将逐步覆盖全球市场及安卓系统,进一步降低用户UGC分享门槛。

3 小时前
2026年4月微软必应团队正式开源Harrier系列词嵌入模型,包含27B、2.7B、0.6B三个参数版本,旗舰27B模型在MTEB v2多语言基准测试中超越OpenAI、谷歌Gemini等主流专有模型登顶。该系列支持超100种语言,上下文窗口达32000词元,采用20亿真实样本加GPT-5合成数据训练,全版本通过MIT许可开放至Hugging Face平台。