登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

OpenAI上线ChatGPT Images 2.0 图像生成能力实现跨越式升级

近日OpenAI正式推出ChatGPT Images 2.0图像生成工具,相较上一代版本,其在画面写实度、细节还原度、指令遵循度等核心指标上均提升超40%,支持多主体复杂场景生成、风格精准复刻、多轮修改等多项新功能,目前已向所有ChatGPT Plus及企业版用户开放,被业内视为AI图像生成赛道的标志性迭代。

不少参与前期灰度测试的用户反馈,此前用AI生成“三花猫蹲在日式老铺的木质窗台边啃鲷鱼烧,背景飘着细雪”这类包含多个主体、场景细节的复杂指令时,经常出现主体遗漏、风格违和、细节穿模等问题,往往要反复调整十几次提示词才能拿到勉强符合要求的成品。而ChatGPT Images 2.0基本可以一次性生成匹配需求的内容,甚至连猫爪上沾的鲷鱼烧碎屑、窗台上磨旧的木纹划痕都能清晰呈现。

过去三年,AI图像生成赛道的迭代速度肉眼可见地放缓,MidJourney、Stable Diffusion、DALL-E等主流产品的更新基本围绕画质提升展开,核心交互逻辑始终没有明显突破:用户需要精准打磨提示词才能获得理想效果,复杂指令的识别误差率长期居高不下,且生成后修改的成本极高。

此前ChatGPT集成的图像生成能力一直基于DALL-E 3模型,主要面向普通用户的轻量需求,专业度始终不及独立图像生成工具。此次推出的ChatGPT Images 2.0,是OpenAI首次针对ChatGPT的交互场景单独优化的专属图像生成版本,专门适配了聊天场景下的多轮修改需求——用户不需要重新输入完整提示词,只要在对话中提出修改要求,模型就能基于上下文调整图像内容。

此次升级最核心的改变,是彻底打通了ChatGPT大语言模型的语义理解能力和图像生成模型的渲染能力,指令遵循准确率从上一代的58%提升至92%,基本可以准确还原用户的口语化描述,不需要用户掌握专业的提示词技巧。

!
信息及评测声明: 本文部分信息整理自互联网公开资料,并包含由 AI创作导航 团队独立进行的实测体验。我们力求内容客观准确,但因工具功能、价格及政策可能存在实时调整,所有信息仅供参考,请务必在使用前访问官网确认。文中观点不构成任何决策建议,读者需自行评估和承担使用风险。如发现内容有误或侵权,欢迎随时反馈,我们将及时核实处理。
相关资讯
AI小创