2026年3月18日,人工智能企业OpenAI正式发布GPT-5.4 mini与GPT-5.4 nano两款轻量化模型。两款产品基于GPT-5.4核心能力定向优化,专为高频响应类任务打造,运行速度较前代提升2倍,在代码编写、逻辑推理、多模态理解等场景表现优于传统大模型,为高频AI应用提供了更高性价比的落地方案。
做前端开发的陈阳最近明显感觉到,自己常用的代码编辑器AI补全工具响应速度快了不少——以往输入半行代码要等1-2秒才会弹出推荐结果,现在几乎是实时生成,准确率反而比之前更高。这背后正是OpenAI最新上线的小型模型带来的体验升级。
随着AI应用从尝鲜转向常态化落地,全参数大模型的高成本、高延迟短板逐渐凸显。第三方统计数据显示,2025年全球AI调用请求中,62%属于代码补全、智能客服应答、短文本理解等高频轻量任务,这类任务不需要大模型的全量能力,反而对响应速度、调用成本有更高要求。
此前OpenAI已经凭借GPT-3.5 mini占据了全球轻量化模型近40%的市场份额,此次推出的两款新模型,正是瞄准了高速增长的高频任务场景,补全了GPT-5.4产品线的低算力区间布局。
据OpenAI官方披露的技术细节,GPT-5.4 mini与nano均保留了GPT-5.4的核心架构能力,通过知识蒸馏、稀疏化训练等技术实现了参数规模的大幅压缩。其中GPT-5.4 mini的运行速度较前代产品提升2倍,在代码精准编辑、代码库导航、前端页面生成等专业场景的表现,甚至超过了不少参数规模是其5倍以上的传统大模型。
在多模态场景下,两款模型也能快速解析密集的图文输入,完成报表识别、商品图内容提取等任务,响应延迟不到0.3秒。而参数更小的GPT-5.4 nano则主打端侧部署能力,无需云端调用即可完成本地的语音识别、图片解析、短文本生成等任务,同时能保障用户数据不离开本地设备,适合智能硬件、企业内部敏感场景的使用需求。
OpenAI方面透露,两款新模型的调用成本仅为全量GPT-5.4的1/10,目前已经开放API调用权限,预计未来半年会接入微软Copilot、GitHub Copilot等全系生态产品。
业内人士认为,此次GPT-5.4系列小模型的发布,进一步拉高了轻量化模型的性能门槛。目前包括Anthropic、DeepSeek、字节跳动在内的多家厂商都在布局同类型产品,2026年小模型赛道的竞争将围绕性能、成本、端侧适配能力展开,普通用户也将享受到更流畅、更低成本的AI服务。

10 小时前
法国人工智能初创公司 Mistral AI 近日宣布完成一笔8.3亿美元的债务融资,资金将专项用于在巴黎郊外建设一座大型数据中心,旨在2026年第二季度投入运营。这一举措标志着欧洲AI生态的关键扩张,旨在应对 生成式AI 竞争激化的全球格局。该交易由多家国际金融机构主导,目标通过本地...

11 小时前
在AI计算需求激增的时代背景下,初创公司Starcloud凭借其创新构想迅速崛起。这家成立于17个月前并通过Y Combinator孵化器快速成长的企业,已成功完成1.7亿美元的A轮融资,成为YC历史上最快达到“独角兽”估值(10亿美元以上)的初创公司。其核心战略聚焦于在近地轨道部署数据中心,旨在利...

12 小时前
2026年3月,北京金山办公软件股份有限公司在武汉召开的2026企业合作伙伴大会上,正式宣布全面开放AI办公生态,将依托核心产品WPS 365构建企业智能知识基座,向渠道合作伙伴开放多赛道资源,推动国内万亿级办公市场从传统功能竞争转向AI生态博弈。最新业绩数据显示,WPS 365相关收入同比大涨65%,成为金山办公AI转型的核心增长引擎。

12 小时前
2026年3月30日,百度旗下基于飞桨(PaddlePaddle)开发的开源光学字符识别(OCR)项目PaddleOCR,正式登顶GitHub Star全球OCR开源项目排名,超越老牌项目Tesseract成为全球关注度最高的OCR开源工具。该项目目前支持80余种主流语言识别,标志着以飞桨为代表的中国深度学习开源框架已具备国际领先的垂直技术影响力。

13 小时前
2026年3月30日,格隆汇援引界面新闻消息披露,国产大模型厂商月之暗面(Moonshot AI)推出Kimi K2.5大模型仅一个月后,公司年度经常性收入(ARR)正式突破1亿美元,成功跻身全球AI商业化第一梯队。此次亮眼营收印证了思考型大模型在企业端的高变现价值,行业也出现企业客户预付千万美元抢购算力配额的罕见现象。

13 小时前
2026年3月30日,据Readhub报道,被誉为“欧洲版OpenAI”的法国AI初创企业Mistral AI完成8.3亿美元债务融资,这笔资金由7家银行组成的财团提供,将全部投入算力基础设施建设,核心采购计划为1.38万片英伟达顶级AI芯片,旨在强化大模型训练推理能力,打破中美在通用人工智能领域的主导格局,是欧洲AI发力全球竞赛的标志性动作。

13 小时前
网络安全厂商Human Security于2026年3月发布《2026年人工智能流量与网络威胁基准报告》,首次明确提出互联网流量结构已发生根本性转折:AI生成的自动化流量正在取代人类,成为网络交互的核心主体。报告数据显示,2025年全球AI驱动流量增长近三倍,增速较人类互联网活动快8倍,其中AI智能体流量同比涨幅高达7851%。

13 小时前
2026年3月30日,爱奇艺正式宣布旗下专业AI智能体平台纳逗Pro开启预商用,这是国内首个步入市场化阶段的影视制作专业智能体。平台接入爱奇艺自研奇智大模型,协同多个主流生成式AI模型,可支持从剧本生成到成片输出的一站式长篇影视创作,2025年底启动内测至今已服务爱奇艺内容团队及多家行业合作伙伴,爱奇艺高级副总裁刘文峰介绍了产品的核心定位。