2026年2月24日,谷歌正式发布新一代大语言模型Gemini 3.1 Pro,这是其首款采用“.1”版本号的模型,基于全新Core Intelligence架构打造,核心推理性能较前代翻倍。在ARC-AGI-2测试中斩获77.1%的高分,更在HLE测试中以44.4%的准确率超越GPT-5.2,标志着通用人工智能推理能力的重大突破。
当GPT-5.2的技术余温还在AI行业持续发酵,谷歌在2026年2月24日的一场闭门技术沟通会上,向外界推出了大模型赛道的全新迭代产品——Gemini 3.1 Pro。与以往0.5递进的版本号规则不同,这次“.1”的后缀,提前向行业传递了“底层架构质变”的明确信号。
过往谷歌Gemini系列的迭代均遵循0.5递进的版本号逻辑,此次直接从3.0跳到3.1,背后是模型核心架构的重构性升级。谷歌AI研发团队负责人表示,Gemini 3.1 Pro并非基于前代的参数堆叠或微调优化,而是完全基于全新Core Intelligence架构打造,研发全程聚焦于通用人工智能(AGI)的核心能力——逻辑推理与复杂问题解决,而非泛化的文本生成或多模态交互表现。采用“.1”的版本命名,正是为了突出这种底层架构带来的质变,而非常规功能迭代。
谷歌官方披露的多组权威基准测试数据,直观印证了Gemini 3.1 Pro的推理实力突破。在衡量通用人工智能推理水平的ARC-AGI-2测试中,该模型斩获77.1%的高分,核心推理性能较上一代Gemini 3模型提升超过两倍,这一成绩在当前已发布的大语言模型中位列全球第一梯队。
更引人关注的是在被业内称为“人类最后考试”的HLE测试中,Gemini 3.1 Pro以44.4%的准确率,成功超越此前长期领跑的GPT-5.2。HLE测试涵盖跨领域复杂问题的推理链拆解、多学科知识整合等难点,这一结果直接证明了Gemini 3.1 Pro在解决高难度复杂任务上的显著优势。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
27 分钟前
美国科技公司谷歌今日正式宣布,旗下主打个人知识管理的AI工具NotebookLM已嵌入Gemini笔记模块,全球全量Gemini用户即日起可在Gemini生态内直接调用NotebookLM的长文本处理、资料问答、结构化内容生成等功能,无需切换独立入口。此次整合是谷歌强化Gemini产品矩阵竞争力、对抗OpenAI ChatGPT等竞品的重要布局,预计将覆盖全球超1亿Gemini活跃用户。

2 小时前
2026年4月,谷歌正式为旗下大模型产品Gemini推出全新notebooks功能,可将用户分散的文件、历史对话、自定义指令整合到专属主题空间,赋予AI长效记忆能力,大幅提升上下文调用精准度,目前该功能已开启小范围灰度,首批面向Gemini AI Ultra、Pro订阅用户开放,同时支持与谷歌现有NotebookLM产品无缝同步。

2 小时前
谷歌DeepMind首席执行官德米斯·哈萨比斯近期公开透露,团队通过打破内部组织壁垒、整合全公司算力与顶尖人才资源,仅用两三年就完成从AI赛道追赶者到领跑者的身份转变,运作效率全面对齐初创公司。当前算力仍是AI研发最大瓶颈,整合后的架构可保障Gemini等核心模型快速迭代,谷歌系实验室贡献了行业90%的AI底层技术突破,能够灵活应对OpenAI、Anthropic等对手的竞争。

7 小时前
2026年4月9日,Google正式宣布将旗下生成式AI模型Gemini深度整合至Gmail产品体系。针对用户普遍担忧的数据隐私问题,Google公开承诺不会利用个人邮件内容训练底层AI模型,同时推出严格的隔离运行机制保障数据安全,整合后的Gemini可实现邮件润色、自动摘要等多项邮件处理辅助功能。

17 小时前
近日,国际计算机协会(ACM)将其最高计算奖项授予大数据和AI基础设施公司Databricks联合创始人Matei Zaharia,以表彰其在分布式计算、开源大数据框架Spark等领域的突出贡献。在获奖发言中,Zaharia首次公开提出当前AGI已经到来的观点,并表示公众和产业界对AGI的定义、应用边界普遍存在误解,该言论引发AI领域广泛讨论。

1 天前
2026年4月8日,Google正式宣布将旗下生成式AI大模型Gemini深度集成至Gmail邮箱服务,针对外界对AI处理敏感隐私数据的普遍质疑,Gmail产品副总裁Blake Barnes代表官方作出三项核心隐私承诺,明确Gemini等基础大模型不会使用用户个人邮件内容训练,所有AI处理环节实现数据隔离、权限自动销毁。

1 天前
《纽约时报》近日披露谷歌搜索AI概览功能准确率约为90%,结合谷歌年超5万亿次的搜索基数测算,该功能每小时可产生超5700万条错误答案,每分钟错误信息量近百万条。初创公司Oumi的评估显示,谷歌Gemini模型准确率已从2025年10月的85%提升至2026年2月的91%,但源信息匹配率却反向下滑,虚假信息传播风险引发行业关注。

1 天前
2026年4月,谷歌母公司Alphabet宣布为旗下AI助手Gemini新增心理健康支持功能,可智能识别用户对话中的自残、自杀倾向并弹出救助入口。同时Alphabet承诺未来3年投入3000万美元,用于支持全球危机热线扩容服务能力,相关功能均经临床专家参与研发,保障干预流程的专业性与安全性。