近日,OpenAI一名工程师不慎在GitHub Codex代码仓库泄露了未发布的GPT-5.4型号信息,引发技术圈广泛关注。尽管OpenAI迅速将版本修正为GPT-5.3-codex,但多方分析认为这并非简单失误,该型号曝光的200万Tokens超长上下文、状态化AI特性,或将终结AI的“金鱼记忆”,预示大模型领域即将迎来重大突破。
2026年3月2日,GitHub上的Codex代码仓库突然掀起躁动——一位OpenAI工程师提交的代码更新中,意外出现了从未对外公布的“gpt-5.4”型号标识。这一细节迅速被开发者捕捉,引发了一场关于未发布大模型的“赛博考古”。
OpenAI的反应瞬时且果断:通过强制推送覆盖相关代码,对外宣称实际型号为“gpt-5.3-codex”,将事件定性为“命名失误”。但这一解释并未平息争议,不少技术从业者指出,泄露的代码片段包含远超现有Codex版本的参数配置,绝非简单的命名混淆能解释,更像是一次半公开的技术信号,暗示大模型领域即将迎来代际升级。
从泄露的alpha模型端点截图和代码分析来看,GPT-5.4的核心特性直击当前大模型的痛点:200万Tokens超长上下文窗口与状态化AI机制。
当前主流大模型的上下文窗口普遍在10万Tokens以内,AI在处理长文档、多轮对话时极易遗忘前置信息,被调侃为“金鱼记忆”。而200万Tokens的容量,相当于能容纳近150万字的中文文本,足以一次性处理整本书籍、大型项目全量代码或长篇法律文书,彻底打破长文本处理的瓶颈。
更具革命性的是状态化AI的引入。与现有大模型每次对话都需重新输入背景信息不同,状态化AI能在长期任务或多轮协作中持续保留“记忆状态”,无需用户反复提醒前置条件。这意味着AI将从“单次对话助手”升级为“长期协作伙伴”,适配企业智能顾问、科研项目跟进等需要持续上下文的场景。
GPT-5.4的潜在突破,将给整个大模型行业带来连锁反应。目前,Anthropic、DeepSeek等厂商均在发力超长上下文模型,但最高参数仍停留在100万Tokens级别。OpenAI若率先推出200万上下文+状态化AI的模型,将再次拉开与竞争对手的技术差距。
这一进展也将倒逼行业加速迭代方向:从单纯的参数竞赛,转向上下文窗口扩展、状态管理优化等更具实用性的技术领域。对于企业用户而言,大模型的“记忆短板”被补齐后,AI在代码开发、内容创作、科研分析等场景的落地效率将大幅提升,催生更多深度应用场景。
关于此次泄露事件,业内存在两种截然不同的解读。一种观点认为,这确实是工程师的操作失误——在测试多个新版本时,误将未发布的型号写入公开仓库。另一种声音则认为,这是OpenAI有意为之的“烟雾弹”:通过提前泄露部分信息,试探市场反应与竞争对手的动向,同时维持自身在大模型领域的关注度。
无论真相如何,有一点可以确定:OpenAI在大模型的上下文与状态化技术上已经取得关键突破,此次泄露的信息,或许就是其下一次重大更新的“预告信号”。

1 分钟前
国内AI企业MiniMax近日面向全球iOS及安卓用户上线移动应用MaxClaw,同步推出全新Coding Plan付费方案。为保障平稳上线,团队紧急扩容服务资源、完成四次系统升级,解决用户量激增引发的响应不稳定问题,并承诺为受影响用户发放积分补偿。此次动作被视为MiniMax布局全球AI市场的重要一步。

3 分钟前
知情人士透露,DeepSeek V4或于下周正式发布,这款大模型将全程基于国产芯片完成训练与推理,并针对华为昇腾、寒武纪思元系列芯片深度优化。此前DeepSeek V3.1已推出适配下一代国产芯片的定制格式,华为Atlas 950 SuperPoD算力规模达前代20多倍,此次软硬协同有望大幅提升国产AI生态竞争力,缩小与国际巨头的差距。

5 分钟前
近日,AI公司Anthropic旗下的AI编程工具Claude Code完成功能更新,正式上线语音编程模式并启动分批推送。目前已有约5%的用户收到功能推送,用户可通过输入指令/voice开启模式,实现语音实时转录文本、混合输入等操作,官方计划未来几周内扩大覆盖范围。

7 分钟前
近日,亚马逊宣布将在路易斯安那州西北部卡多与博西尔教区投资120亿美元建设AI数据中心园区,这是其在该州首次大规模布局。项目预计直接创造540个全职岗位,带动1710个关联就业,同时配套4亿美元用于水利、清洁能源及STEM教育,将从多维度推动当地经济与产业升级。

9 分钟前
近日苹果AI战略遭遇核心算力困境:近90%私有云计算服务器处于闲置状态,实际部署仅10%,因内部AI基础设施碎片化、各团队技术栈不统一,暂时借谷歌服务器支撑下一代Siri。今年苹果将推出由定制版Gemini模型驱动的重大改版Siri,同时推进代号“Baltra”的自研AI服务器芯片项目,试图突围当前困局。

10 分钟前
QuestMobile发布2025年12月AI原生App市场数据显示,豆包以22669万(约2.26亿)月活用户位居榜首,这一数字超过了DeepSeek、元宝、蚂蚁阿福、千问4款竞品的月活总和。数据凸显豆包在AI原生App市场的绝对优势,在竞争加剧的背景下,其领先地位或进一步巩固,竞品追赶难度极大。

12 分钟前
近日,深度求索(DeepSeek)推出旗下大模型DeepSeek V4 Lite的0302迭代版本,这款拥有2000亿参数规模、支持100万token超长上下文处理的模型,在逻辑推理、审美生成及功能性表现上实现显著提升,综合性能已逼近海外顶流大模型Anthropic Claude3.5 Sonnet,为国产大模型的国际竞争力提升注入新动力。

18 分钟前
近日,由华为云驱动的全球首个端到端AI视频导演Agent——Zopia正式亮相。这款AI系统依托对话式多智能体与技能协同调度技术,仅需用户输入创意文本或简单故事梗概,就能在24小时内自动完成从剧本拆解、分镜设计、多镜头生成到最终剪辑的全流程,产出电影级短剧、品牌视频等成品,目前其Beta版免费体验已收获热烈反响。