Google发布Gemini 3 Deep Think 全球仅7名人类能在编程上击败它
2026年2月13日,Google旗下主打深度推理的大模型Gemini 3 Deep Think正式发布,在编程、科研与工程硬核领域取得颠覆性突破。最引人瞩目的是它在算法竞赛平台Codeforces上拿下3455 Elo高分,全球仅7名人类顶尖选手能与之抗衡,不仅刷新AI推理能力的天花板,也为各领域的AI深度应用打开全新想象空间。
当大多数AI模型还在通用能力赛道上竞速时,Google此次将核心方向锚定在“深度推理”——这一被认为是AI逼近人类高阶智能的关键领域。Gemini 3 Deep Think的登场,用实打实的成绩证明了AI在复杂逻辑思考、跨领域问题解决上的飞跃。
在编程领域,它的表现堪称“封神级”。Codeforces作为全球最具权威性的算法竞赛平台之一,其Elo评分体系直接反映选手的算法设计与问题解决能力,3455分的成绩意味着它已跻身人类顶级梯队。对比一年前同类AI模型的最高得分2727分,此次提升幅度超过26%;而在人类选手中,目前仅有7人能在该平台击败它,这7人无一例外都是多次斩获国际算法竞赛冠军的顶尖程序员。这一成绩打破了“AI只能完成简单编码任务”的刻板印象,证明AI已经能独立解决需要复杂逻辑链、创新性思路的高阶算法问题。
不止于编程,Gemini 3 Deep Think在科研领域的表现同样亮眼。它曾在一篇高深物理数学论文的预印本中,发现了连人类同行评审都遗漏的细微逻辑漏洞——这一发现不仅避免了错误结论的传播,更展示了AI在处理高精度、高复杂度科研内容时的严谨性。此外,它还成功证明了数学界知名的“Erdős猜想”中的多个子问题,该猜想以提出者保罗·埃尔德什命名,是数十年来困扰数学家的难题,AI的介入为这类前沿科研课题提供了新的解题思路。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年5月15日,QQ浏览器与腾讯元宝联合发布高考场景专属AI技能,首批上线地区分数线查询、一分一段查询核心功能,同时计划推出行业首个高考咨询师Agent“元宝高考通”。产品整合教育在线·掌上高考官方权威招考数据,旨在解决全国超1300万高考考生志愿填报普遍存在的信息差与数据可信度痛点。

1 小时前
2026年5月,全球AI技术测评团队完成了面向软件开发场景的AI Agent专项基准测试,本次测试覆盖市面上17款主流商用、开源AI Agent产品,覆盖代码生成、漏洞修复、架构设计三大核心开发场景,DeepSeek Dev Agent、OpenAI GPT-4o Coding Agent、Code...

2 小时前
近期海外科技领域推出一款新型决策辅助AI工具,区别于OpenAI ChatGPT、Google Gemini、DeepSeek等主流大模型侧重生成答案、直接给出方案的产品逻辑,该工具核心能力为识别用户决策过程中的逻辑漏洞、信息盲区与非理性偏差,不会替用户做出最终选择,实测中对错误决策的预警准确率可达87%,填补了AI辅助决策赛道的细分空白。

2 小时前
近期,由北美多所高校联合AI安全实验室发布的最新研究显示,当前OpenAI GPT-4o Computer Use、谷歌Gemini Advanced、微软Copilot等主流可操作电脑的AI代理产品,在处理整理表格、筛选邮件等常规办公任务时平均成功率仅为22%,超6成测试案例出现操作偏差,11%的案例发生不可逆错误,远未达到厂商宣传的商用标准。

2 小时前
近日有行业动向显示,科技巨头谷歌正在筹备推出性能大幅升级的新一代Gemini大模型,目标直指OpenAI旗下核心产品ChatGPT的现有市场优势。据第三方机构预估,新版Gemini将在多模态理解、逻辑推理、长上下文处理等核心指标上实现15%-30%的性能提升,有望打破当前全球消费级大模型市场的现有竞争格局。

2 小时前
近日谷歌正式推出搭载全栈Gemini能力的全新AI原生笔记本产品线,该设备打破传统笔记本AI功能仅局限于特定APP的限制,实现系统级、全场景的AI能力调用,覆盖办公创作、信息检索、多模态内容处理等多个使用场景,官方数据显示其AI功能场景覆盖率较行业平均水平提升超70%,是目前消费电子市场首款实现大模型全链路打通的便携计算设备。

2 小时前
近日谷歌正式推送搭载AI能力的Android Auto版本更新,内置Google Gemini多模态大模型,可实现自然语音控车、动态行程规划、场景化内容推荐等功能。本次更新覆盖全球超1亿台适配Android Auto的在售车型,是继苹果发布内置Apple Intelligence的新一代CarPlay后,全球科技巨头在车载AI赛道落地的又一标志性事件。

2 小时前
近日谷歌举办2026年度安卓开发者大会,正式发布搭载原生Gemini Intelligence能力的Android 17操作系统,同步推出AI二合一硬件Googlebook。本次更新将AI原生能力下沉至系统底层,预计上线后覆盖全球超18亿安卓活跃设备,成为全球迄今为止规模最大的消费级AI落地场景之一。