近日OpenAI正式推出ChatGPT Images 2.0图像生成工具,相较上一代版本,其在画面写实度、细节还原度、指令遵循度等核心指标上均提升超40%,支持多主体复杂场景生成、风格精准复刻、多轮修改等多项新功能,目前已向所有ChatGPT Plus及企业版用户开放,被业内视为AI图像生成赛道的标志性迭代。
不少参与前期灰度测试的用户反馈,此前用AI生成“三花猫蹲在日式老铺的木质窗台边啃鲷鱼烧,背景飘着细雪”这类包含多个主体、场景细节的复杂指令时,经常出现主体遗漏、风格违和、细节穿模等问题,往往要反复调整十几次提示词才能拿到勉强符合要求的成品。而ChatGPT Images 2.0基本可以一次性生成匹配需求的内容,甚至连猫爪上沾的鲷鱼烧碎屑、窗台上磨旧的木纹划痕都能清晰呈现。
过去三年,AI图像生成赛道的迭代速度肉眼可见地放缓,MidJourney、Stable Diffusion、DALL-E等主流产品的更新基本围绕画质提升展开,核心交互逻辑始终没有明显突破:用户需要精准打磨提示词才能获得理想效果,复杂指令的识别误差率长期居高不下,且生成后修改的成本极高。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录