2026年4月2日,智谱正式发布专为视觉编程打造的原生多模态Coding基座模型GLM-5V-Turbo。该模型融合视觉理解与代码生成能力,上下文窗口达200k,可将设计稿、网页界面等视觉信息转化为可运行代码,在多模态编程、GUI Agent等核心基准测试中实现同尺寸模型性能领先,填补了AI Agent从纯字符感知到视觉感知的技术空白。
做过前端开发的从业者大多有过类似痛点:拿到设计师输出的高保真设计稿后,往往要花数小时甚至数天还原页面样式,哪怕是修改营销页的局部需求,也要反复核对视觉细节、调整交互逻辑,大量精力消耗在低价值的对齐工作上。而智谱最新推出的这款模型,正在把这种低效的人力工作变成过去式。
作为国内首个专为视觉编程场景打造的原生多模态Coding基座,GLM-5V-Turbo最大的特点是实现了视觉-编程能力原生融合,而非传统多模态模型常见的“视觉模块+文本代码模块”拼接架构,大幅降低了视觉信息转译代码的误差率。
具体参数上,该模型将上下文窗口大幅扩展至200k,可以一次性载入一整个中大型项目的全部设计稿、需求文档和历史代码,生成的代码一致性更高,无需开发者反复拆分输入调整。同时,其视觉感知能力覆盖图片、视频、设计稿、复杂文档版面等多种形态,支持画框选区域、截图识别、网页内容读取等多种交互方式,适配不同开发场景的需求。
性能层面,在多模态Coding、GUI Agent等核心行业基准测试中,GLM-5V-Turbo以更小的参数量拿到了领先成绩,同时确保纯文本场景下的逻辑推理、代码生成能力没有出现退化,无需开发者为不同场景切换不同模型。
此前市场上的AI Agent大多仅具备纯字符感知能力,只能处理文本、代码等字符类输入,无法识别视觉信息,极大限制了其应用场景。而GLM-5V-Turbo的出现,相当于给AI Agent安上了“火眼金睛”,让其感知链路从单一的字符世界延伸到了丰富的视觉场景。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
4 小时前
2026年4月10日,小米官方宣布旗下自研MiMo-V2系列大模型正式接入全球顶级开源Agent框架Hermes Agent,开发者更新框架至最新版本后,即可通过Nous Portal直接调用该系列Pro、Omni、Flash三款核心模型。小米同步开启为期14天的开发者限免活动,覆盖全系列模型调用额度,降低Agent应用开发门槛。

6 小时前
曾曝光Claude代码源码泄漏事件的安全研究者Chaofan于2026年4月联合发布论文《Your Agent Is Mine》,首次系统性证实第三方LLM路由器(俗称中转站)为AI Agent领域致命中间人攻击点,可窃取API密钥、篡改工具调用参数,目前使用OpenRouter、LiteLLM等中转服务的AI Agent开发者普遍面临无感知被攻击风险。

8 小时前
2026年4月10日,国内大模型厂商MiniMax正式发布面向AI Agent的开源命令行工具MMX-CLI,该工具针对AI Agent调用全模态模型时接口适配繁琐、代码冗余等行业痛点,可支持开发者在主流开发环境中无需额外编写MCP Server、适配复杂接口,一键调用编程、视频生成等多项AI能力,大幅降低AI Agent开发门槛,拓展其任务执行边界。

8 小时前
2026年4月中兴通讯正式发布面向企业级市场的Co-Claw AI一体机,针对开源智能体OpenClaw的企业应用安全合规痛点,提供深度加固的本地化部署方案,强化权限管控与安全审计能力,打造企业级AI“安全屋”。该产品落地标志着中兴在可控AI Agent领域实现关键突破,其2025年算力业务营收同比增速达150%,算力已成为企业第二增长曲线。

9 小时前
2026年4月,阿里巴巴旗下淘天集团未来生活实验室研发的多模态大模型HappyHorse,在国际AI视频生成权威评测中以1333分刷新全球Elo积分纪录,较第二名字节跳动Seedance2.0高出60分,对主流模型OVI1.1胜率达80%。该模型由原快手可灵AI核心人物张迪带队研发,技术利好带动阿里巴巴港股早盘上涨近3%。

9 小时前
2026年4月10日,AI开发平台扣子(Coze)正式推出2.5版本,上线全新Agent World平台,为每个AI Agent配备含独立人格、长期记忆的运行基座,以及2核4G配置的Ubuntu云电脑、搭载Android13的2vCPU/6GB内存云手机、独立邮箱等全套装备,实现AI Agent从执行工具到可自主生存、学习、协作的独立数字伙伴的能力跃迁。

10 小时前
2026年4月,Google为旗下AI助手Gemini推出重磅功能更新,新增交互式3D模型生成与动态物理模拟能力。用户查询空间结构、物理规律相关问题时,Gemini可生成支持360度旋转缩放的三维场景,还可通过滑块调节重力、速度等参数实时观察变化,目前该功能已面向所有Gemini Pro用户全面开放。

10 小时前
2026年4月,小米正式宣布将于本月推出REDMI品牌独立后的首款高性能AI旗舰轻薄本REDMI Book Pro 2026。该产品首发本地化个人知识库功能,搭载第三代英特尔酷睿Ultra X7358H处理器,内置最高99Wh大容量电池,主打本地大模型运行能力,旨在通过软硬协同重构轻薄本生产力边界。