少找工具,多做创作

阿里发布Wan2.7-Image生图大模型 支持像素级捏脸及长文本渲染

2026年4月1日,阿里正式推出图像生成与编辑统一大模型Wan2.7-Image,该模型突破传统AI生图同质化、指令对齐难的行业痛点,支持从骨相到五官细节的像素级捏脸,搭载调色盘风格迁移功能,最高支持3K token文本输入,可稳定输出含公式、表格的印刷级图文内容,大幅提升了AI生图的个性化程度与专业场景适配能力。

不少AI生图用户都有过类似体验:输入再具体的五官描述,生成的人脸依旧带着统一的“AI网红感”,要捏出符合预期的专属角色往往要调整几十轮prompt;需要生成带公式、表格的图文材料时,AI输出的内容更是频频出现错字、乱码,根本无法直接使用。这一普遍存在的行业痛点,近期随着阿里新模型的发布迎来了解决方案。

近年来AI生图技术快速普及,从C端的娱乐创作到B端的设计、营销场景都有广泛应用,但核心瓶颈始终存在:一方面人像生成的同质化严重,千人一面的“标准AI脸”无法满足游戏、数字人等领域的个性化定制需求;另一方面文字渲染能力不足,长文本、公式、表格的输出错误率高,导致AI生图很难进入教育、出版等专业生产场景。据此前行业调研数据显示,有近62%的B端用户将“个性化定制精度不足”列为AI生图工具的首要缺点。

此次阿里发布的Wan2.7-Image,针对上述两大痛点做了全链路的技术优化。首先在人像生成领域,模型强化了像素级捏脸功能,支持用户从骨相、轮廓到眼眸、唇形等五官细节的全维度定制,不管是丹凤眼、高颧骨这类特征化长相,还是特定角色的标志性细节,都能精准实现,彻底告别此前AI生图的“标准脸”问题。

在艺术创作与专业场景适配方面,模型首次搭载“调色盘”风格迁移功能,用户只需上传参考图,就能一键提取其色调占比,不管是马蒂斯的高饱和度红色系,还是梵高的暖黄色调,都能精准迁移到新生成的作品中,大幅降低了设计师的风格调整成本。更值得关注的是,该模型将生图领域的文本输入阈值提升到了3K token,可以稳定输出包含复杂公式、表格的整页A4纸图文内容,印刷级的渲染精度直接填补了此前专业场景的应用空白。

业内人士认为,Wan2.7-Image的发布标志着国内AI生图技术已经从通用娱乐阶段,进入到适配专业生产需求的新阶段。从应用场景来看,该模型的高精度捏脸功能可以直接服务于游戏角色定制、数字人形象创作、动漫人设生产等领域,而长文本渲染能力则能覆盖教育教辅生成、专业出版物排版、工业设计文档可视化等此前AI工具很难渗透的场景,未来AI生图的商业化落地空间将进一步打开。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创