2026年3月18日,人工智能企业OpenAI正式发布GPT-5.4 mini与GPT-5.4 nano两款轻量化模型。两款产品基于GPT-5.4核心能力定向优化,专为高频响应类任务打造,运行速度较前代提升2倍,在代码编写、逻辑推理、多模态理解等场景表现优于传统大模型,为高频AI应用提供了更高性价比的落地方案。
做前端开发的陈阳最近明显感觉到,自己常用的代码编辑器AI补全工具响应速度快了不少——以往输入半行代码要等1-2秒才会弹出推荐结果,现在几乎是实时生成,准确率反而比之前更高。这背后正是OpenAI最新上线的小型模型带来的体验升级。
随着AI应用从尝鲜转向常态化落地,全参数大模型的高成本、高延迟短板逐渐凸显。第三方统计数据显示,2025年全球AI调用请求中,62%属于代码补全、智能客服应答、短文本理解等高频轻量任务,这类任务不需要大模型的全量能力,反而对响应速度、调用成本有更高要求。
此前OpenAI已经凭借GPT-3.5 mini占据了全球轻量化模型近40%的市场份额,此次推出的两款新模型,正是瞄准了高速增长的高频任务场景,补全了GPT-5.4产品线的低算力区间布局。
据OpenAI官方披露的技术细节,GPT-5.4 mini与nano均保留了GPT-5.4的核心架构能力,通过知识蒸馏、稀疏化训练等技术实现了参数规模的大幅压缩。其中GPT-5.4 mini的运行速度较前代产品提升2倍,在代码精准编辑、代码库导航、前端页面生成等专业场景的表现,甚至超过了不少参数规模是其5倍以上的传统大模型。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 小时前
2026年以来,美国加州AI算力集群用电需求同比上涨42%,带动全州平均电价上浮18%。此前长期为硅谷度假胜地太浩湖供电的太平洋燃气电力公司合约将于今年年底到期,受AI用电缺口挤压,其续约报价较此前上涨37%,迫使太浩湖市政部门启动新一轮能源供应商招标,优先考虑可稳定供电的清洁能源服务商。

15 小时前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

17 小时前
AI编码初创企业Cursor于2026年5月宣布启动全球化扩张进程,未来半年将在亚太地区招聘200名技术及市场类员工,新加坡办事处由资深科技高管Simon Green负责。此前该公司已与SpaceX达成重磅合作协议,SpaceX拥有600亿美元收购Cursor的权利,若未触发收购则需支付100亿美元采购其研发成果,充足资金加持下Cursor正加速技术出海落地。

17 小时前
2026年5月15日,人工智能企业OpenAI宣布将旗下代码生成模型Codex正式集成至iOS、Android双端ChatGPT移动应用,面向全球开发者提供移动端远程编码管理能力。目前Codex周活跃用户已突破400万,本次更新打破办公场景限制,支持多开发环境实时同步,开发者可利用碎片时间处理紧急代码需求。

17 小时前
2026年5月15日,阿里云正式发布智能开发产品Qoder1.0,完成从传统AI集成开发环境(IDE)到“智能体自主开发工作台”的战略升级。产品核心采用Agent-first工作范式,新增Quest独立视窗,重构Agent Harness底层技术,搭载首创的团队级知识引擎,实测可将代码保留率提升11%,大幅降低开发者处理工程细节的负担。

17 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

17 小时前
2026年5月,OpenAI正式宣布将AI编程模型Codex集成至ChatGPT的iOS及Android移动端应用。本次更新针对手机使用场景做了专属交互适配,支持开发者在通勤、线下休闲等非办公场景快速完成代码审批、逻辑调试等碎片化编程任务,标志着AI编程工具正式从桌面生产力阶段迈入全时伴随的发展新阶段。

17 小时前
2026年5月,旧金山AI初创公司depthfirst开发的AI安全分析系统,自主发现潜伏18年的NGINX高危漏洞CVE-2026-42945。该漏洞CVSS评分为9.2,属于严重级别,影响2008年以来发布的NGINX 0.6.27至1.30.0版本,波及全球近三分之一网站,攻击者可利用漏洞实现远程代码执行,目前NGINX官方已发布对应修复补丁。