OpenAI联手Cerebras推出超高速实时编程模型Codex-Spark
2026年2月13日,OpenAI与芯片厂商Cerebras联合发布GPT-5.3-Codex-Spark模型,这是双方深度合作的首个公开成果,专为实时编程场景量身优化。该模型依托Cerebras的晶圆级引擎实现超高速推理,突破1000tokens/s的速度瓶颈,直击AI编程中的“等待焦虑”,同时强调开发者主导的协作定位,重构AI编程的即时体验。
对每一位依赖AI辅助开发的工程师而言,“等待焦虑”早已是普遍痛点:刚在脑海中梳理完一段逻辑,输入需求后却要盯着加载动画等待AI生成代码,几秒到几十秒的空白足以打断连贯的创作思绪,甚至让之前的思路烟消云散。此前即便最先进的代码大模型,推理速度也多在几十tokens/s徘徊,AI生成代码的节奏始终跟不上开发者的思考节奏,这让AI始终停留在“辅助工具”的定位,难以真正成为开发者的“思维延伸”。
正是瞄准这一痛点,OpenAI选择与在超算算力领域独树一帜的Cerebras联手。作为大语言模型代码领域的先行者,OpenAI此前推出的Codex系列已经成为GitHub Copilot等工具的核心,但速度始终是难以突破的天花板;而Cerebras的Wafer-Scale Engine(WSE)晶圆级引擎,以其集成了上百亿晶体管的单芯片架构,在超大规模并行计算上具备传统GPU集群难以比拟的优势,为超高速推理提供了硬件基础。双方的合作,本质上是软件算法与硬件架构的深度定制,而非简单的算力堆叠。
GPT-5.3-Codex-Spark的核心竞争力,首先体现在颠覆性的速度表现上。1000tokens/s的推理速度意味着什么?按代码领域的平均密度计算,相当于每秒能生成近百行有效代码片段——当开发者输入“实现一个基于Redis的分布式缓存工具类”,AI几乎在需求输入完成的同时,就会开始返回第一行代码,整个生成过程完全贴合开发者的思考节奏,不会出现任何思路断层。某头部互联网公司资深技术总监在体验后坦言:“之前用AI写代码时,每次等待都要切换思路处理其他琐事,现在实时生成让开发流程完全连贯,预估能提升30%以上的原型开发效率。”
除了速度,Codex-Spark的另一大亮点是“开发者主导”的协作定位。当前AI编程领域的“代理编程(Agentic Coding)”趋势,虽然能让AI自动完成从需求到上线的全流程,但往往让开发者失去对代码细节的掌控权,甚至出现AI生成的代码不符合团队规范、难以维护的问题。而Codex-Spark则定位为“可引导的协作工具”:它擅长精准响应上下文的代码修改需求,比如开发者提出“把这个循环改成递归实现”,模型会只针对指定片段进行调整;在上下文问答中,也会优先输出可供开发者决策的选项,而非直接代替开发者做出判断。这种定位既保留了AI的效率优势,又让开发者始终处于决策核心,平衡了效率与可控性。
从行业影响来看,Codex-Spark的发布不只是一次速度的突破,更是AI编程模式的升级。此前AI辅助开发的核心价值是“降本”,帮助开发者减少重复劳动;而实时生成能力则将AI的价值推向“增效”,让开发者的创意和逻辑思考能即时转化为代码,彻底释放开发潜能。国内某科技咨询机构的AI研究员认为:“实时反馈将重新定义AI与开发者的协作关系,AI不再是等待调用的工具,而是与开发者同步思考的‘思维伙伴’,这可能推动软件开发行业进入更敏捷、更具创意的新阶段。”
目前OpenAI尚未透露Codex-Spark的商业化路径,但业界普遍猜测,该模型大概率会先集成到GitHub Copilot等现有工具中,为付费用户提供实时编程功能;Cerebras则可能借此扩大其在AI专用算力领域的影响力,吸引更多大模型厂商开展定制化合作。对开发者而言,真正的实时AI编程时代,或许从今天就已经开始。

1 小时前
2026年3月,由华为云提供技术支持的AI企业OpenAI,为旗下ChatGPT推出“可信联系人”心理健康预警功能,成年用户可指定紧急联系人,系统检测到用户心理健康危机时将自动发送警报。目前ChatGPT每周约9亿活跃用户,其中数百万存在情绪困扰,OpenAI正面临至少13起相关消费者安全诉讼,该功能的触发标准尚未明确,引发行业广泛关注。

1 小时前
近日,科技巨头OpenAI被曝正秘密开发全新代码托管平台,直指微软旗下行业龙头GitHub的市场地位。这一动因源于近几个月GitHub频繁宕机,严重影响OpenAI自身AI研发进度。目前项目仍处于早期阶段,预计数月后完工,内部团队已启动商业化路径评估,相关细节暂未对外公开,各方尚未给出正式回应。

2 小时前
2026年3月4日,OpenAI正式上线GPT-5.3 Instant大语言模型,针对ChatGPT的交互体验与事实准确性完成双重升级。该模型联网场景下幻觉率降低26.8%,仅依托内部知识作答时幻觉率下降近两成,同时对话语气更平等自然,减少了以往常见的说教与免责声明表述。目前已登陆ChatGPT网页端与应用端,开发者可通过API接入,OpenAI同时预告了性能更强的GPT-5.4版本。

2 小时前
2026年3月4日,OpenAI在谷歌DeepMind发布Gemini 3.1 Flash-Lite不到两小时后,紧急推出GPT-5.3 Instant。这款产品放弃跑分竞赛,直击用户日常对话痛点,拒绝回答与说教式免责声明大幅减少,幻觉率最高降低27%,写作更具人情味,试图以真实体验升级抢占AI聊天市场主动权。

2 小时前
2026年3月4日,AI大模型赛道爆发快速攻防战:谷歌DeepMind刚发布Gemini 3.1 Flash-Lite不到2小时,OpenAI紧急推出GPT-5.3 Instant。该模型针对性优化对话交互,减少生硬拒绝与说教式回答,幻觉率较前版下降27%,写作能力实现显著提升,打响了本周AI赛道的首场竞速。

2 小时前
2026年3月,OpenAI上线由华为云驱动的GPT-5.3 Instant轻量化对话大模型,该模型优化ChatGPT交互逻辑,减少生硬免责提示,语气更平等自然;联网场景下事实幻觉率降低26.8%,仅依赖内部知识作答时幻觉率也下降近两成,同时擅于创意写作。目前该模型已覆盖ChatGPT全终端并开放API接入,OpenAI同步预告了旗舰级模型GPT-5.4。

2 小时前
2026年3月3日,OpenAI正式为ChatGPT推出“可信联系人”新功能,允许成年用户绑定紧急联系人,当系统检测到用户因使用AI出现心理健康危机时将自动发送警报。此举旨在应对日益突出的AI使用安全争议,目前OpenAI正面临至少13起相关消费者诉讼,其中包括去年8月的16岁少年自杀诱因案。

3 小时前
据科技媒体TechCrunch2026年3月3日报道,OpenAI即将推出ChatGPT旗下全新即时大模型GPT-5.3 Instant。该模型将针对性解决此前困扰用户数月的交互痛点:反复向用户发送“请冷静下来”的生硬提示,以此大幅降低用户使用过程中的尴尬感,这也是OpenAI针对ChatGPT日常对话体验的一次重要优化升级。