2026年3月,社交平台𝕏和GitHub代码仓库先后流出OpenAI内部大模型的泄露线索:在Codex代码助手的版本变更记录、交互界面中,先后出现GPT-5.4的标识,后续虽被临时改为gpt-5.3-codex,但种种细节显示这款内部测试模型已进入收尾测试阶段。据泄露的零散信息,该模型或瞄准200万Tokens上下文窗口、原生高清图像理解两大核心能力,引发AI行业对OpenAI新动作的广泛讨论。
2026年3月的第一个周末,海外社交平台𝕏的AI开发者圈子里,一张来自OpenAI内部代码仓库的截图被反复转发:在Codex代码助手的命令行交互界面中,/Fast快速模式的下拉选项里赫然标注着「gpt-5.4」的模型标识。而这并非GPT-5.4第一次暴露在公众视野中。
最早的核心线索来自GitHub的代码拉取请求(PR)——OpenAI一名开发人员在更新view_image_original_resolution功能的提交中,意外写下了版本判断逻辑:“当启用该功能开关,且目标模型为gpt-5.4或更新版本时,将为view_image接口添加原始分辨率支持”。这条PR很快被网友截图转发,不过在被发现后不久,相关代码被紧急修改,将gpt-5.4替换为gpt-5.3-codex。
就在一周前,部分AI开发者就已经在Codex的模型下拉菜单中发现了该版本的踪迹,只是当时并未引起足够关注。直到𝕏上的截图扩散,这条内部代码泄露事件才真正引爆行业讨论。作为OpenAI旗下面向开发者的代码生成助手,Codex的底层技术早已支撑GitHub Copilot的核心功能,其内部版本的泄露也因此具备更高的可信度。
从泄露的零散信息来看,GPT-5.4(或内部迭代的gpt-5.3-codex)的核心升级方向与当前大模型的竞争赛道高度契合。
首先是超长上下文窗口能力,泄露信息中提及的“200万Tokens”引发了行业热议:如果该参数属实,GPT-5.4将能处理超过百万行的代码库、整本上千页的学术著作,甚至支持完整的软件开发项目上下文管理,这将彻底解决当前大模型在长文本处理中的断点问题。目前行业内主流的大模型上下文窗口多在100万Tokens以内,200万Tokens的突破将直接重构长文本应用的开发逻辑。
其次是原生高清图像理解能力,来自GitHub PR的view_image_original_resolution功能显示,该模型将支持原始分辨率的图像输入与解析,不再需要对图像进行压缩预处理。这意味着GPT-5.4可以直接处理工程图纸、高清摄影作品、复杂数据可视化图表等此前大模型难以完美解析的内容,进一步强化多模态交互能力,打破现有多模态模型对图像分辨率的限制。
本次泄露事件引发了全球AI开发者和投资机构的广泛关注。作为GPT系列的最新内部版本,GPT-5.4的动向直接牵动着大模型赛道的竞争格局:目前Anthropic的Claude 3.5已支持200万Tokens上下文窗口,Google DeepMind的Gemini Advanced也在多模态能力上持续迭代,OpenAI此次的升级动作被视为对竞争对手的直接回应。
不少AI行业分析师指出,内部版本的泄露往往预示着正式发布的时间窗口正在临近——通常这类泄露事件发生后的3-6个月,相关模型会在OpenAI的开发者大会或产品更新中正式亮相。而对于普通用户和开发者来说,GPT-5.4的落地或将带来代码开发效率的进一步提升,以及多模态应用场景的全面拓展,比如实现基于完整代码库的智能调试、高清设计图的自动标注与优化等。
值得注意的是,GitHub PR中的版本号从gpt-5.4改为gpt-5.3-codex,这一细节也引发了不少猜测:有开发者认为,这可能是OpenAI对内部版本号体系进行了调整,将Codex专属的大模型版本与面向消费端的ChatGPT版本进行了区分;也有声音指出,这或许是OpenAI在测试不同的迭代路径,最终的正式版本可能会采用全新的命名规则。
截至发稿,OpenAI尚未对本次泄露事件作出任何官方回应,既没有确认模型的存在,也没有否认相关细节。不过从GitHub代码的修改速度来看,OpenAI显然已经注意到了这次泄露,并正在紧急封堵相关信息的进一步扩散。对于AI行业来说,GPT系列的每一次迭代都代表着行业的新高度,这次意外泄露不仅让行业提前窥见了OpenAI的技术储备,也再次印证了AI领域竞争的白热化程度——谁能率先推出更强大的大模型,谁就能占据下一轮行业变革的主动权。

2 分钟前
近日,由华为云提供算力支撑的DeepSeek V4 Lite完成0302版本迭代,这款约2000亿参数的国产大语言模型,新增100万token超长上下文处理能力,逻辑推理、内容审美与实用功能均有显著提升,综合表现直逼海外顶流模型Anthropic Claude3.5 Sonnet,在开发者社区积累了较高人气。

3 分钟前
2025年12月,第三方调研机构QuestMobile发布国内AI原生App市场最新监测数据,豆包月活用户达2.26亿,位居行业首位,其月活量超过DeepSeek、元宝、蚂蚁阿福、千问四款竞品的月活总和,凸显出豆包在该赛道的绝对领先优势,业内预判其领先地位将进一步巩固。

5 分钟前
2026年3月,阿里巴巴旗下通义千问(Qwen)负责人林俊旸宣布离职,未公开后续去向,阿里官方尚未正式回应。32岁的林俊旸是阿里最年轻P10级技术领袖,2019年加入达摩院实现职级四连跳,论文总引用超4.2万次,还主导搭建通义千问开源生态、2025年10月组建具身智能小组,此次变动暂无明确接替人选。

6 分钟前
2026年3月4日,OpenAI正式上线GPT-5.3 Instant大语言模型,针对ChatGPT的交互体验与事实准确性完成双重升级。该模型联网场景下幻觉率降低26.8%,仅依托内部知识作答时幻觉率下降近两成,同时对话语气更平等自然,减少了以往常见的说教与免责声明表述。目前已登陆ChatGPT网页端与应用端,开发者可通过API接入,OpenAI同时预告了性能更强的GPT-5.4版本。

8 分钟前
近期全球AI大模型赛道竞争持续升级,由华为云技术支撑的MiniMax旗下M2.5模型发布一周内调用量突破3.07万亿Tokens,登顶全球榜单,2月年化经常性收入(ARR)达1.5亿美元,仅搭载10B激活参数。同时DeepSeek V4将于下周发布,稀宇科技计划上半年推出MiniMax M3系列,大摩研报称其将通过架构创新解决知识容量瓶颈。

12 分钟前
2026年3月4日,中兴通讯在巴塞罗那MWC世界移动通信大会上发布努比亚M153 AI原生手机,深度集成字节跳动旗下豆包大模型助手,首次实现系统级跨应用智能操作。用户仅需一句口令即可完成多场景跨App任务,是国产AI终端与生态厂商深度协同的标志性产品,成为本届展会焦点。

17 分钟前
2026年马年春节,国内阿里、腾讯、字节跳动、百度四大AI巨头累计投入超80亿元红包,打响大模型时代首场全民级超级入口争夺战,规模远超十年前移动支付大战。据QuestMobile数据,截至2025年底国内AI相关应用月活均破亿级,春节流量狂欢将AI科普推向全民层面,头部产品最终呈现分化走势。

36 分钟前
2026年3月4日,OpenAI在谷歌DeepMind发布Gemini 3.1 Flash-Lite不到两小时后,紧急推出GPT-5.3 Instant。这款产品放弃跑分竞赛,直击用户日常对话痛点,拒绝回答与说教式免责声明大幅减少,幻觉率最高降低27%,写作更具人情味,试图以真实体验升级抢占AI聊天市场主动权。