2026年3月4日,AI大模型赛道爆发快速攻防战:谷歌DeepMind刚发布Gemini 3.1 Flash-Lite不到2小时,OpenAI紧急推出GPT-5.3 Instant。该模型针对性优化对话交互,减少生硬拒绝与说教式回答,幻觉率较前版下降27%,写作能力实现显著提升,打响了本周AI赛道的首场竞速。
2026年3月4日上午8点12分,科技媒体新智元率先披露了这场极速攻防:谷歌DeepMind于当日7点50分左右发布轻量型大模型Gemini 3.1 Flash-Lite,主打实时交互与轻量化部署,而不到2小时后,OpenAI就同步推出了GPT-5.3 Instant作为回应。这场毫无铺垫的版本更新,打破了此前大模型数月一更的迭代节奏,将赛道的竞争烈度推向新的高度。
近期AI大模型赛道的竞争已经从参数堆料转向了迭代速度与场景适配。2026年以来,Anthropic、百度文心一言、腾讯混元等头部玩家均加速了版本更新频率,而谷歌与OpenAI作为赛道的两大巨头,此前的更新周期普遍维持在1-2个月。此次谷歌率先推出针对实时交互的Gemini 3.1 Flash-Lite,显然瞄准了日常对话、实时问答等大众高频使用场景,OpenAI的快速跟进,既是对用户需求的快速响应,也是对市场份额的直接争夺。
GPT-5.3 Instant的核心升级直指此前用户吐槽最多的问题。其一,消解了被用户称为“AI爹味”的说教感与生硬拒绝,此前不少用户反馈,GPT系列会在回答边界问题时过度说教,或直接以“无法提供相关信息”回绝,新模型调整了对话策略,会更贴合用户的实际需求给出灵活回应;其二,幻觉率较前版下降27%,作为大模型的顽疾,幻觉问题一直影响用户的使用信任,此次优化显著提升了信息的准确性;其三,写作能力实现跳级,在文案生成、代码注释、内容整理等场景中,新模型生成的内容逻辑更清晰、表达更自然,大幅降低了用户的二次修改成本。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 小时前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

15 小时前
2026年5月15日,人工智能公司xAI正式推出Agentic命令行工具Grok Build早期测试版,该产品定位智能开发助手,可实现项目结构分析、代码编写、错误调试、开发任务自动化等功能,目前仅向SuperGrok Heavy订阅用户开放,用户可通过x.ai/cli申请体验,后续将根据用户反馈快速迭代优化。

15 小时前
2026年5月15日,千问APP正式宣布与国家药监局信息中心达成深度战略合作,全面接入覆盖药品、化妆品、医疗器械三大类别的数百万份国家级权威数据,可通过权威数据源实时校核大幅降低健康咨询类回答的幻觉问题,将为平台数千万用户提供精准用药指导、成分检索等服务,标志着国产大模型垂直领域专业化、合规化建设取得关键进展。

15 小时前
2026年5月行业监测数据显示,埃隆·马斯克旗下由SpaceX与xAI合并而成的SpaceXAI正遭遇严重人才危机,2026年2月至今已有超50名顶尖研发人员离职,覆盖编程助手、世界模型、Grok语音交互、预训练等核心团队,近20名离职人员转投Meta、Thinking Machines Lab等竞品,引发行业对其技术迭代能力的广泛质疑。

15 小时前
2026年5月15日,人工智能企业OpenAI宣布将旗下代码生成模型Codex正式集成至iOS、Android双端ChatGPT移动应用,面向全球开发者提供移动端远程编码管理能力。目前Codex周活跃用户已突破400万,本次更新打破办公场景限制,支持多开发环境实时同步,开发者可利用碎片时间处理紧急代码需求。

15 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

15 小时前
2026年5月,OpenAI正式宣布将AI编程模型Codex集成至ChatGPT的iOS及Android移动端应用。本次更新针对手机使用场景做了专属交互适配,支持开发者在通勤、线下休闲等非办公场景快速完成代码审批、逻辑调试等碎片化编程任务,标志着AI编程工具正式从桌面生产力阶段迈入全时伴随的发展新阶段。

15 小时前
2026年5月15日,埃隆·马斯克旗下人工智能公司xAI正式推出首款专业编程AI智能体Grok Build,进军高增速的开发者服务市场。该产品目前处于早期测试阶段,仅面向xAI付费订阅用户开放,可自动完成代码编写、逻辑构建等复杂编程任务。xAI总裁迈克尔·尼科尔斯明确将Anthropic旗下Claude列为核心对标目标,计划短期内追平行业标杆表现。