2026年4月2日,国产大模型厂商智谱正式发布旗下首个多模态Coding基座模型GLM-5V-Turbo,该模型具备“视觉+代码”跨模态生成能力,可基于草图、UI设计稿直接生成可运行前端工程,实测视觉编程性能较Claude Opus高出4.6%,是智谱在GLM-5-Turbo之后推出的又一编程类大模型迭代产品。
记者从实测案例中看到,用户仅上传一张潦草的手绘网页草稿照片,未附加任何尺寸标注、交互逻辑说明,GLM-5V-Turbo就能在10秒内输出包含HTML、CSS、JavaScript的完整前端代码,部署后即可还原草稿中的页面布局、按钮跳转等核心功能,元素位置匹配度超过92%。
此前主流的AI编程工具均以纯文本输入为核心交互逻辑,开发者需要将可视化的设计需求转化为文字描述prompt,不仅沟通成本高,还经常出现大模型对需求理解偏差的问题。随着前端开发、小程序开发等场景的需求爆发,“视觉输入直接生成代码”成为各大厂商攻坚的核心方向,此前Anthropic旗下的Claude Opus、OpenAI的GPT-4V均已上线相关能力,其中Claude Opus长期占据视觉编程赛道的性能榜首。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录