登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

智谱发布GLM-5V-Turbo多模态编程模型 性能超Claude Opus4.6%

2026年4月2日,国产大模型厂商智谱正式发布旗下首个多模态Coding基座模型GLM-5V-Turbo,该模型具备“视觉+代码”跨模态生成能力,可基于草图、UI设计稿直接生成可运行前端工程,实测视觉编程性能较Claude Opus高出4.6%,是智谱在GLM-5-Turbo之后推出的又一编程类大模型迭代产品。

记者从实测案例中看到,用户仅上传一张潦草的手绘网页草稿照片,未附加任何尺寸标注、交互逻辑说明,GLM-5V-Turbo就能在10秒内输出包含HTML、CSS、JavaScript的完整前端代码,部署后即可还原草稿中的页面布局、按钮跳转等核心功能,元素位置匹配度超过92%。

此前主流的AI编程工具均以纯文本输入为核心交互逻辑,开发者需要将可视化的设计需求转化为文字描述prompt,不仅沟通成本高,还经常出现大模型对需求理解偏差的问题。随着前端开发、小程序开发等场景的需求爆发,“视觉输入直接生成代码”成为各大厂商攻坚的核心方向,此前Anthropic旗下的Claude Opus、OpenAI的GPT-4V均已上线相关能力,其中Claude Opus长期占据视觉编程赛道的性能榜首。

GLM-5V-Turbo是智谱在今年初发布的纯文本编程模型GLM-5-Turbo基础上迭代而来,新增了专门针对设计稿、手绘草图优化的视觉编码器,不需要额外OCR步骤就能直接识别页面元素的位置、属性、潜在交互逻辑。对比行业通用的“OCR识别+文本生成”两段式方案,其推理速度提升37%,元素识别错误率下降28%。在行业通用的视觉编程基准测试集上,GLM-5V-Turbo的综合得分较Claude Opus高出4.6%,登顶当前公开模型的视觉编程性能榜。

!
信息及评测声明: 本文部分信息整理自互联网公开资料,并包含由 AI创作导航 团队独立进行的实测体验。我们力求内容客观准确,但因工具功能、价格及政策可能存在实时调整,所有信息仅供参考,请务必在使用前访问官网确认。文中观点不构成任何决策建议,读者需自行评估和承担使用风险。如发现内容有误或侵权,欢迎随时反馈,我们将及时核实处理。
相关资讯
AI小创