谷歌发布Gemini 3.1 Pro:推理性能翻倍,多项测试超GPT-5.2

11 小时前 AI快讯 0

2026年2月24日,谷歌推出基于全新Core Intelligence架构的大语言模型Gemini 3.1 Pro。该模型实现推理性能翻倍,在ARC-AGI-2、HLE等多项基准测试中超越OpenAI GPT-5.2,支持100万Token超长上下文与强大多模态视觉能力,目前已接入Gemini应用、NotebookLM,向全球开发者开放体验。

当大语言模型的竞争进入“性能精度双升级”的深水区,谷歌用一份亮眼的测试成绩单打破了当前的平衡——Gemini 3.1 Pro在推理能力上的跨越式提升,让行业再次聚焦大模型架构革新的核心价值。

Gemini 3.1 Pro的性能突破,核心源于谷歌全新推出的Core Intelligence架构。不同于此前Gemini系列的基础架构,这套全新体系从底层重构了模型的逻辑推理、多模态信息融合机制,通过优化计算资源分配与算法路径,直接实现了推理性能翻倍的效果,为模型处理复杂任务提供了更高效的计算底座。

在行业权威基准测试中,Gemini 3.1 Pro的表现全面碾压竞品。在衡量通用推理能力的ARC-AGI-2测试中,模型拿下77.1%的高分,这一成绩较上一代Gemini模型提升超过两倍;在侧重复杂任务处理的HLE测试中,44.4%的准确率不仅超过Anthropic的Claude Opus4.6,更是直接超越OpenAI的GPT-5.2,展现出在高级逻辑问题解决、专业知识应用上的绝对优势。

除了推理性能,Gemini 3.1 Pro在实用场景上也实现了关键突破。它支持100万Token超长上下文,意味着能一次性处理整本长篇小说、数十页技术文档或多小时的语音转写内容,无需分段拆分,大幅提升长文本理解与生成效率;同时,其强化的视觉能力可精准解析图像、视频中的细节,支持多模态内容的生成与交互。目前,该模型已正式接入Gemini官方应用和NotebookLM笔记工具,全球开发者可通过谷歌开发平台体验其全部功能。

此次Gemini 3.1 Pro的发布,让大模型赛道的竞争再次升温。此前OpenAI凭借GPT系列长期占据第一梯队领先位置,谷歌Gemini系列虽有迭代但未实现全面反超。而这次架构革新带来的性能突破,不仅会倒逼OpenAI等竞争对手加速模型迭代,也将推动AI应用在长文档处理、企业级复杂推理等场景的进一步落地,为各行各业的AI解决方案升级提供新的技术支撑。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创