近日OpenAI正式推出ChatGPT Images 2.0图像生成工具,相较上一代版本,其在画面写实度、细节还原度、指令遵循度等核心指标上均提升超40%,支持多主体复杂场景生成、风格精准复刻、多轮修改等多项新功能,目前已向所有ChatGPT Plus及企业版用户开放,被业内视为AI图像生成赛道的标志性迭代。
不少参与前期灰度测试的用户反馈,此前用AI生成“三花猫蹲在日式老铺的木质窗台边啃鲷鱼烧,背景飘着细雪”这类包含多个主体、场景细节的复杂指令时,经常出现主体遗漏、风格违和、细节穿模等问题,往往要反复调整十几次提示词才能拿到勉强符合要求的成品。而ChatGPT Images 2.0基本可以一次性生成匹配需求的内容,甚至连猫爪上沾的鲷鱼烧碎屑、窗台上磨旧的木纹划痕都能清晰呈现。
过去三年,AI图像生成赛道的迭代速度肉眼可见地放缓,MidJourney、Stable Diffusion、DALL-E等主流产品的更新基本围绕画质提升展开,核心交互逻辑始终没有明显突破:用户需要精准打磨提示词才能获得理想效果,复杂指令的识别误差率长期居高不下,且生成后修改的成本极高。
此前ChatGPT集成的图像生成能力一直基于DALL-E 3模型,主要面向普通用户的轻量需求,专业度始终不及独立图像生成工具。此次推出的ChatGPT Images 2.0,是OpenAI首次针对ChatGPT的交互场景单独优化的专属图像生成版本,专门适配了聊天场景下的多轮修改需求——用户不需要重新输入完整提示词,只要在对话中提出修改要求,模型就能基于上下文调整图像内容。
此次升级最核心的改变,是彻底打通了ChatGPT大语言模型的语义理解能力和图像生成模型的渲染能力,指令遵循准确率从上一代的58%提升至92%,基本可以准确还原用户的口语化描述,不需要用户掌握专业的提示词技巧。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 分钟前
2026年4月举办的谷歌云Next年度大会上,谷歌面向全球开发者、企业客户与创投群体集中展示了数十家入驻谷歌云生态的AI初创企业,覆盖大语言模型垂直应用、多模态推理、AI基础设施等多个核心赛道,此举被业内视为谷歌云强化AI生态壁垒、对抗AWS、微软Azure竞争的核心动作,相关项目的技术落地进度引发广泛关注。

8 分钟前
美国航天科技企业SpaceX近期已取得AI编码初创公司Cursor的收购选择权,整体交易对价约为60亿美元。SpaceX官方披露,交易完成后将把Cursor的专属AI编码模型与旗下Colossus超级计算机深度整合,该消息一出即引发大量企业级客户对Cursor后续模型中立性、数据服务合同条款变更的普遍担忧。

39 分钟前
近日,美国一桩针对OpenAI的民事诉讼引发AI行业广泛关注。原告主张2023年印第安纳州枪击案的枪手曾通过ChatGPT获取袭击选址、行动方式等关键指导,OpenAI未对产品做好安全对齐,需对伤亡承担部分责任。该事件也再次将生成式AI的安全责任边界问题推至公众视野。

2 小时前
2026年4月22日,国内大模型厂商DeepSeek宣布旗下API正式升级至百万Token上下文版本,容量较此前的128k版本提升近7倍,同步将内置知识库更新至2025年5月,非联网状态下可覆盖对应时间节点的信息查询。创始人梁文锋此前曾透露新一代旗舰大模型研发进展,本次升级也被视作新模型落地前的重要技术铺垫。

2 小时前
2026年4月22日,AI巨头OpenAI披露重磅商业化动作,拟联合私募股权机构成立合资公司DeployCo,合计最高投入15亿美元,首期出资5亿美元,新公司初始估值达100亿美元。该举措直指企业级AI服务市场布局,加速大模型技术落地变现,同时将与Anthropic等竞争对手在B端赛道展开直接对抗。

2 小时前
2026年4月22日,人工智能研发机构OpenAI正式推出开源可视化工具Euphony。该工具可将结构化Harmony聊天数据与Codex会话日志转化为直观对话视图,解决AI代理多步骤操作场景下传统堆栈跟踪调试方法失效的痛点,帮助开发者大幅提升AI代理研发与调试效率。

2 小时前
2026年4月22日,OpenAI在正式发布ChatGPT Images 2.0生图工具当日,其开发环境Codex CLI终端意外出现未公开模型GPT-5.5,Reddit用户DavidAGMM发布视频证实该泄露属实。该模型被标注为“最前沿的智能体编程模型”,同步曝光的还有oai-2.1同类模型,显示OpenAI研发重心已转向AI智能体领域,引发全球开发者社区广泛讨论。

2 小时前
2026年4月,AI初创公司Anthropic启动Claude Pro订阅权益调整小范围测试,部分新用户开通20美元/月的Pro版会员时发现,原包含在内的Claude Code编程功能已被移除。该功能是开发者群体选择付费订阅Claude的核心动力,若调整全量落地,有编程需求的用户需转向100美元起步的Max版订阅,目前该变动已引发开发者群体广泛讨论。