登录体验完整功能(收藏、点赞、评论等)

谷歌发布Gemini 3.1 Pro:推理性能翻倍,基准测试领先GPT-5.2

2026年2月24日,谷歌正式发布新一代大语言模型Gemini 3.1 Pro,这是其首款采用“.1”版本号的模型,基于全新Core Intelligence架构打造,核心推理性能较前代翻倍。在ARC-AGI-2测试中斩获77.1%的高分,更在HLE测试中以44.4%的准确率超越GPT-5.2,标志着通用人工智能推理能力的重大突破。

当GPT-5.2的技术余温还在AI行业持续发酵,谷歌在2026年2月24日的一场闭门技术沟通会上,向外界推出了大模型赛道的全新迭代产品——Gemini 3.1 Pro。与以往0.5递进的版本号规则不同,这次“.1”的后缀,提前向行业传递了“底层架构质变”的明确信号。

过往谷歌Gemini系列的迭代均遵循0.5递进的版本号逻辑,此次直接从3.0跳到3.1,背后是模型核心架构的重构性升级。谷歌AI研发团队负责人表示,Gemini 3.1 Pro并非基于前代的参数堆叠或微调优化,而是完全基于全新Core Intelligence架构打造,研发全程聚焦于通用人工智能(AGI)的核心能力——逻辑推理与复杂问题解决,而非泛化的文本生成或多模态交互表现。采用“.1”的版本命名,正是为了突出这种底层架构带来的质变,而非常规功能迭代。

谷歌官方披露的多组权威基准测试数据,直观印证了Gemini 3.1 Pro的推理实力突破。在衡量通用人工智能推理水平的ARC-AGI-2测试中,该模型斩获77.1%的高分,核心推理性能较上一代Gemini 3模型提升超过两倍,这一成绩在当前已发布的大语言模型中位列全球第一梯队。

更引人关注的是在被业内称为“人类最后考试”的HLE测试中,Gemini 3.1 Pro以44.4%的准确率,成功超越此前长期领跑的GPT-5.2。HLE测试涵盖跨领域复杂问题的推理链拆解、多学科知识整合等难点,这一结果直接证明了Gemini 3.1 Pro在解决高难度复杂任务上的显著优势。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创