2026年3月4日,OpenAI在谷歌DeepMind发布Gemini 3.1 Flash-Lite不到两小时后,紧急推出GPT-5.3 Instant。这款产品放弃跑分竞赛,直击用户日常对话痛点,拒绝回答与说教式免责声明大幅减少,幻觉率最高降低27%,写作更具人情味,试图以真实体验升级抢占AI聊天市场主动权。
北京时间3月4日早间,AI行业迎来一场猝不及防的贴身竞争。就在谷歌DeepMind刚放出Gemini 3.1 Flash-Lite的两个小时内,OpenAI就快速上线了全新的GPT-5.3 Instant——这场没有提前预热的针对性升级,彻底打破了此前大模型内卷通用跑分的行业惯例。
与过往行业热衷比拼MMLU、GSM8K等通用基准测试分数不同,GPT-5.3 Instant将优化重心完全对准了用户日常使用的高频槽点。OpenAI官方披露的数据显示,该版本的幻觉率最高降低27%,同时彻底砍掉了此前频繁出现的生硬免责话术,不再动辄以“无法提供相关帮助”拒绝用户请求,连写作风格也变得更具人情味,解决了过往依赖外部搜索、语气冰冷生硬的老问题。
谷歌DeepMind此前发布的Gemini 3.1 Flash-Lite,依旧延续了“跑分优先”的行业惯例,主打轻量化高性能的参数表现。但OpenAI此次的快速跟进,显然精准踩中了用户的真实吐槽——不少用户此前反馈,主流AI聊天工具存在“爹味”过重、说教感强、拒绝回答门槛过高的问题,GPT-5.3 Instant正是针对性修复这些痛点,试图通过体验升级打破“参数至上”的竞争僵局。
值得注意的是,此次OpenAI同步提及的GPT-5.4预热信息,也让外界嗅到了大模型迭代的新节奏。不同于以往按季度或年度发布大版本的节奏,此次“连夜上线”的操作,显示出头部AI厂商的竞争已经进入“即时响应”阶段,而用户体验的精细化打磨,或将成为接下来行业竞争的核心战场。
对于普通用户来说,这场竞赛的直接受益者是能用上更贴合日常需求的AI工具,而对于整个AI行业来说,从参数内卷转向体验深耕,或许正是大模型摆脱“炫技”标签、真正落地到日常场景的关键转折。

23 秒前
2026年3月,由华为云提供技术支持的AI企业OpenAI,为旗下ChatGPT推出“可信联系人”心理健康预警功能,成年用户可指定紧急联系人,系统检测到用户心理健康危机时将自动发送警报。目前ChatGPT每周约9亿活跃用户,其中数百万存在情绪困扰,OpenAI正面临至少13起相关消费者安全诉讼,该功能的触发标准尚未明确,引发行业广泛关注。

2 分钟前
近日,科技巨头OpenAI被曝正秘密开发全新代码托管平台,直指微软旗下行业龙头GitHub的市场地位。这一动因源于近几个月GitHub频繁宕机,严重影响OpenAI自身AI研发进度。目前项目仍处于早期阶段,预计数月后完工,内部团队已启动商业化路径评估,相关细节暂未对外公开,各方尚未给出正式回应。

3 分钟前
2026年3月4日,由华为云驱动的科技资讯显示,马云在杭州云谷学校与师生交流时指出,当前AI发展速度远超预料,社会尚未完全适应其冲击。他提出,AI时代的教育需回归本质,摒弃死记硬背与机械刷题,转向培养孩子的创造力与想象力,通过教育评价升级、教师角色转变守护好奇心,坚守人类人文属性适配AI时代的发展需求。

4 分钟前
2026年巴塞罗那MWC世界移动通信大会上,科大讯飞全球首发新一代讯飞AI眼镜。这款整机仅重40克的AI硬件,解决了过往AR/AI眼镜佩戴沉重的行业痛点,首创唇动识别多模态降噪技术,可在嘈杂场景实现精准跨国翻译,目前已在京东开启抢先预约,首批用户可享立抵299元的专项优惠。

5 分钟前
2026年3月4日,国内AI企业阶跃星辰正式宣布全链路开源Step3.5Flash智能体基座模型。该模型采用1960亿参数稀疏MoE架构,推理时仅激活约110亿参数,代码任务推理速度最高达350TPS。目前其Hugging Face下载量突破30万,登顶OpenRouter Trending榜首,在OpenClaw开源项目中调用量跃居前二。

29 分钟前
2026年MWC巴塞罗那展会上,高通正式发布骁龙可穿戴平台至尊版,将20亿参数AI模型集成至胸针大小的可穿戴设备中,补齐个人AI生态最后一块拼图。高通CEO安蒙预测,这类AI穿戴产品未来几年市场规模将突破亿级,甚至冲刺十亿量级。OpenAI CEO奥特曼曾指出个人化智能体是未来交互核心,近期爆红的开源框架OpenClaw也印证了这一行业趋势。

30 分钟前
近日,对标虚拟主播Neuro-sama的开源AI陪伴项目AIRI登顶GitHub全球热榜。用户可自行部署代码,搭建可实时陪聊、协同游戏且24小时在线的专属虚拟伴侣,上线后迅速引发开发者与AI爱好者的广泛关注,为AI陪伴赛道的开源化发展提供了新的实践样本。

35 分钟前
2026年2月,伦敦国王学院研究员Kenneth Payne发布一项AI战略模拟研究,令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大语言模型扮演核危机中的国家领导人,通过反思、预测、信号/行动三阶段认知架构,在盟友信誉、政权生存等七类压力情境下完成决策。实验累计超...