2026年4月2日,国内大模型厂商智谱正式推出专为视觉编程场景打造的多模态Coding基座模型GLM-5V-Turbo。该模型实现视觉与编程能力深度融合,支持图片、视频、设计稿、复杂文档版面识别,上下文窗口达200k,在多模态编程、GUI Agent核心基准测试中性能领先于同类产品,可大幅拓展AI Agent的感知边界。
敲代码前还要对着设计稿手动标注尺寸、对照数十页需求文档梳理交互逻辑的开发者,即将迎来大幅解放生产力的新工具。4月2日智谱面向开发者群体上线的GLM-5V-Turbo,直接砍掉了从视觉需求到可运行代码之间的大量冗余中间环节。
此前行业内的主流编程大模型大多以文本为核心输入载体,仅能处理文字化的需求指令,面对设计稿、界面截图、手绘原型这类视觉类需求,还需要开发者手动将视觉信息转化为文字描述,不仅效率低下,还很容易出现信息传递的偏差。而面向GUI交互的AI Agent,也长期受限于视觉感知能力不足,无法适配复杂的界面操作场景。
作为国内首个原生多模态Coding基座模型,GLM-5V-Turbo没有走通用多模态模型叠加代码能力、或是纯代码模型叠加视觉能力的拼接路线,而是从训练阶段就实现了视觉理解与代码生成能力的深度对齐。
该模型核心参数亮点突出:上下文窗口扩展至200k,可一次性载入完整的工程项目代码、数十页需求文档和全套设计规范;原生支持图片、视频、设计稿、复杂文档版面的识别理解,还支持画框选区域、截图输入、网页读取等多种视觉工具调用,实现对需求的精准感知。
据官方披露的测试数据,GLM-5V-Turbo在多模态编程、GUI Agent等核心基准测试中,以更小的参数规模取得了超越同类产品的表现,推理成本也远低于参数规模更大的同类产品。
GLM-5V-Turbo的上线,直接打通了从“视觉需求”到“可运行代码”的全链路,有望重构多个场景的工作流程。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
40 分钟前
2026年4月8日,国内SaaS服务商微盟正式发布零售行业首个专属AI Skill“Weimob Admin Skills”,并宣布接入OpenClaw(龙虾)生态。作为国内SaaS领域首支垂直领域AI Skill产品,其可将零售行业知识转化为标准化可复用组件,支持商家通过自然语言完成经营任务自动化执行,推动零售SaaS从对话式AI迈向执行式AI阶段。

4 小时前
2026年4月8日,智谱正式开源旗下新一代大模型GLM-5.1,该产品专为长程任务优化,在专业软件开发基准测试SWE-Bench Pro中拿下58.4分的全球最佳成绩,性能超过已发布的GPT-5.4、Claude Opus 4.6等海外闭源大模型,同时优于MiniMax M2.7、Kimi K2.5等同类开源产品,为AI长程场景落地提供了高性价比的新选项。

5 小时前
近日苹果旗下搭载M5自研芯片的15英寸MacBook Air开启150美元专属优惠,到手价低于1200美元。该机型支持最新Wi-Fi 7技术,内置苹果端侧AI框架Apple Intelligence,可实现大模型推理完全本地运行,是当前消费级笔记本市场中端侧AI能力突出的代表性产品,也反映了消费电子厂商争相布局端侧AI落地的行业趋势。

7 小时前
2026年4月8日智谱正式发布新一代大模型GLM-5.1,据模型聚合平台OpenRouter监测,GLM系列模型单价同步上调10%,调价后编程场景价格对标Anthropic旗下Claude3.5 Sonnet。该模型在SWE-bench Pro基准测试中超越Claude4.6 Opus登顶,支持单次8小时长时自主作业,此次调价也是国产大模型首次在主流场景与全球头部厂商价格对齐。

7 小时前
2026年4月8日志谱AI发布新一代开源大模型GLM-5.1,该模型实现长程执行与代码能力双重突破,可支持最长8小时独立复杂任务处理,在SWE-Bench Pro基准测试中修复高难度工程Bug的表现超越GPT-5.4、Claude Opus4.6等国际顶级模型,单次任务可执行超1200步操作,输出成果等同于4名资深开发一周工作量。

9 小时前
2026年4月,权威AI评测平台Artificial Analysis旗下AI Video Arena榜单更新,神秘AI视频生成模型Happy Horse(含V1、V2版本)上线即超越此前稳居榜首的Seedance2.0登顶。该模型在文本转视频任务的画面一致性、细节还原度、运动自然度等核心指标上全面领先,还原生支持同步音频生成,引发全球AI社区广泛关注。

9 小时前
2026年4月7日,创意软件巨头Adobe正式推出面向学生群体的免费AI学习工具Student Spaces。该工具依托Acrobat技术底座,集成多模态解析能力,支持免登录使用,可处理PDF、Office文档、手写笔记等多格式资料,提供记忆卡片生成、AI播客转换等全流程学习功能,标志着Adobe正式将AI版图从专业生产力领域拓展至教育生态。

11 小时前
近期微软旗下GitHub宣布为命令行版AI编程工具Copilot CLI新增Rubber Duck审查代理功能,该功能通过调用不同AI家族的独立大模型,对主生成代理的代码方案进行交叉核验、质疑底层假设、排查潜在风险。据GitHub内部灰度测试数据,该功能可将代码逻辑漏洞、不合理配置检出率提升近35%,大幅降低开发者后期调试成本。