谷歌发布Gemini 3.1 Pro:推理性能翻倍,基准测试领先GPT-5.2

14 小时前 AI快讯 6

2026年2月24日,谷歌正式发布新一代大语言模型Gemini 3.1 Pro,这是其首款采用“.1”版本号的模型,基于全新Core Intelligence架构打造,核心推理性能较前代翻倍。在ARC-AGI-2测试中斩获77.1%的高分,更在HLE测试中以44.4%的准确率超越GPT-5.2,标志着通用人工智能推理能力的重大突破。

当GPT-5.2的技术余温还在AI行业持续发酵,谷歌在2026年2月24日的一场闭门技术沟通会上,向外界推出了大模型赛道的全新迭代产品——Gemini 3.1 Pro。与以往0.5递进的版本号规则不同,这次“.1”的后缀,提前向行业传递了“底层架构质变”的明确信号。

过往谷歌Gemini系列的迭代均遵循0.5递进的版本号逻辑,此次直接从3.0跳到3.1,背后是模型核心架构的重构性升级。谷歌AI研发团队负责人表示,Gemini 3.1 Pro并非基于前代的参数堆叠或微调优化,而是完全基于全新Core Intelligence架构打造,研发全程聚焦于通用人工智能(AGI)的核心能力——逻辑推理与复杂问题解决,而非泛化的文本生成或多模态交互表现。采用“.1”的版本命名,正是为了突出这种底层架构带来的质变,而非常规功能迭代。

谷歌官方披露的多组权威基准测试数据,直观印证了Gemini 3.1 Pro的推理实力突破。在衡量通用人工智能推理水平的ARC-AGI-2测试中,该模型斩获77.1%的高分,核心推理性能较上一代Gemini 3模型提升超过两倍,这一成绩在当前已发布的大语言模型中位列全球第一梯队。

更引人关注的是在被业内称为“人类最后考试”的HLE测试中,Gemini 3.1 Pro以44.4%的准确率,成功超越此前长期领跑的GPT-5.2。HLE测试涵盖跨领域复杂问题的推理链拆解、多学科知识整合等难点,这一结果直接证明了Gemini 3.1 Pro在解决高难度复杂任务上的显著优势。

从GPT-4o的多模态升级到Gemini 3.1 Pro的推理突破,大模型行业的竞争焦点正在悄然转移。此前行业普遍将参数规模、多模态兼容性作为核心卖点,但随着企业级AI应用的深入落地,用户对模型的逻辑推理、复杂任务处理能力需求日益迫切。

Gemini 3.1 Pro的发布,无疑将推动整个行业的研发重心向核心推理能力倾斜。未来,通用人工智能的竞争将不再局限于“能看会说”的表面功能,而是转向“会思考、能解决复杂问题”的底层能力比拼,这也将加速AGI从实验室走向实际产业场景的进程。

谷歌AI负责人在发布会上透露,Core Intelligence架构将成为未来Gemini系列迭代的核心底座,后续还将推出Gemini 3.1 Ultra版本,进一步提升推理性能的同时,强化多模态与推理能力的深度融合。此外,谷歌计划在2026年第二季度正式开放Gemini 3.1 Pro的API接口,让全球开发者能够基于该模型搭建各类复杂的AI应用,从代码自动生成到科研问题推理,覆盖更多高价值场景。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创