登录体验完整功能(收藏、点赞、评论等) — 已累计有 9957 人加入

谷歌DeepMind推出AlphaProof Nexus 破解56年埃尔德什难题

2026年5月,谷歌DeepMind正式发布AI数学推理框架AlphaProof Nexus,凭借独创四级智能体架构,结合Gemini基础模型与Lean编译器协同推理,成功解开两道悬置56年的埃尔德什数学难题。在353个埃尔德什开放问题测试中,该系统共解决9个相关问题,同时证明整数序列在线百科全书44个开放猜想,为AI形式化推理领域带来里程碑式突破。

作为20世纪最具影响力的数学家之一,保罗·埃尔德什一生提出了数千个涉及数论、组合数学领域的开放问题,不少问题因证明逻辑复杂度极高,已滞留学界数十年之久。此次被AlphaProof Nexus破解的两道难题,此前已有近十代数学家尝试攻坚,均未取得实质性进展。2026年5月26日,谷歌DeepMind正式对外公布了这一研究成果,立刻引发了数学界和AI领域的双重震动。

不同于此前单一模型驱动的AI推理系统,AlphaProof Nexus采用了四级智能体架构的独创设计,四个智能体的推理复杂度逐级提升,形成了闭环迭代的推理链路。

第一层由Gemini基础模型与Lean形式化编译器交互,率先将自然语言描述的数学问题转化为机器可验证的形式化代码,从根源上避免自然语言表述的歧义问题;第二层引入智能代码补全机制,快速生成初步的证明路径片段;第三层接入类似AlphaEvolve的进化算法,对已有的证明片段进行交叉变异,不断拓展可能的推理方向;第四层则是整合所有生成的证明草稿,对其逻辑完整性、简洁度进行自动评分排序,最终输出最优的可验证证明结果。

在官方公开的测试集中,研发团队选取了353个未被解决的埃尔德什开放问题作为测试样本,AlphaProof Nexus不仅成功破解了其中9个,还额外证明了整数序列在线百科全书(OEIS)中收录的44个未证猜想,远超此前所有AI数学推理系统的最好成绩。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯