2026年5月,谷歌DeepMind正式发布AI数学推理框架AlphaProof Nexus,凭借独创四级智能体架构,结合Gemini基础模型与Lean编译器协同推理,成功解开两道悬置56年的埃尔德什数学难题。在353个埃尔德什开放问题测试中,该系统共解决9个相关问题,同时证明整数序列在线百科全书44个开放猜想,为AI形式化推理领域带来里程碑式突破。
作为20世纪最具影响力的数学家之一,保罗·埃尔德什一生提出了数千个涉及数论、组合数学领域的开放问题,不少问题因证明逻辑复杂度极高,已滞留学界数十年之久。此次被AlphaProof Nexus破解的两道难题,此前已有近十代数学家尝试攻坚,均未取得实质性进展。2026年5月26日,谷歌DeepMind正式对外公布了这一研究成果,立刻引发了数学界和AI领域的双重震动。
不同于此前单一模型驱动的AI推理系统,AlphaProof Nexus采用了四级智能体架构的独创设计,四个智能体的推理复杂度逐级提升,形成了闭环迭代的推理链路。
第一层由Gemini基础模型与Lean形式化编译器交互,率先将自然语言描述的数学问题转化为机器可验证的形式化代码,从根源上避免自然语言表述的歧义问题;第二层引入智能代码补全机制,快速生成初步的证明路径片段;第三层接入类似AlphaEvolve的进化算法,对已有的证明片段进行交叉变异,不断拓展可能的推理方向;第四层则是整合所有生成的证明草稿,对其逻辑完整性、简洁度进行自动评分排序,最终输出最优的可验证证明结果。
在官方公开的测试集中,研发团队选取了353个未被解决的埃尔德什开放问题作为测试样本,AlphaProof Nexus不仅成功破解了其中9个,还额外证明了整数序列在线百科全书(OEIS)中收录的44个未证猜想,远超此前所有AI数学推理系统的最好成绩。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
19 分钟前
2026年5月26日,支付宝正式宣布旗下“AI支付”已完成3亿笔AI智能体支付交易,可支持95%通用智能体框架,成为全球首个实现大规模商用的AI原生支付基建。本次支付宝同步推出全球首个Token Pay服务与AI钱包产品,联合已有的AI付、AI收能力构建全栈AI原生支付体系,为AI时代交易链路搭建底层基础设施。

1 小时前
近日,面向联邦学习落地场景的标准化算法测试方案正式对外发布,该方案基于NVIDIA推出的联邦学习开源框架NVIDIA FLARE,实现了FedAvg、FedProx两款主流联邦学习算法在非IID(非独立同分布)CIFAR-10图像数据集上的搭建与横向性能对比,为分布式AI训练的算法选型提供了可复现的参考路径,填补了跨节点隐私计算场景下算法效能验证的工具空白。

1 小时前
2026年5月21至22日,OpenAI正式宣布旗下桌面代理产品Codex新增“锁屏运行”功能,面向Mac用户开放。该功能打破传统AI代理需设备解锁、屏幕常亮的运行限制,支持用户在设备锁屏、息屏状态下通过远程指令操控本地应用,可覆盖大型代码编译、GUI自动化测试等长时复杂工程场景,大幅降低开发者值守成本。

1 小时前
2026年5月26日,本地数字人创作工具AIGCPanel正式推出2.0.0版本,此次更新被官方称为“史上改动最大的一次”,核心搭载工作流引擎与CLI命令行工具,整合数字人合成、语音克隆、音视频处理全链路能力,通过LogicFlow画布引擎实现节点式流程编排,彻底解决AI创作工具碎片化痛点,将数字人生产效率提升超80%。

1 小时前
全球管理咨询公司美世近期发布《全球人才趋势》报告,针对825名企业高层的调研显示,99%的受访者预计未来两年内AI应用将触发企业不同规模的裁员。2026年初至今全球科技行业裁员已突破10万人,AI普及成为核心诱因之一,当前企业员工积极工作状态占比已从2024年的66%降至44%,职场焦虑持续蔓延。

1 小时前
2026年5月26日,2026福布斯中国人工智能科技企业TOP50系列评选结果正式公布,深耕纸包装产业30余年的浙江东经科技股份有限公司入选「生态建设与开源贡献企业」子榜单,系浙江唯一获评该奖项的企业。该公司依托多层级AI智能体矩阵实现纸包装全链路数字化,为传统制造业数智化转型提供了可复制的落地样本。

1 小时前
2026年5月央视曝光直播电商、短视频带货领域多重违规套路,其中利用AI合成技术伪造专家肖像、声音为商品背书,以及将普通日化品、食品虚假宣传为“医用级”产品、治疗类药品的行为频发,严重侵害消费者权益。国家市场监管总局已部署为期半年的互联网广告专项整治行动,对上述乱象重拳打击。

1 小时前
近日,多名开发者在OpenAI Codex后端日志中发现其尚未官宣的新一代旗舰大模型GPT-5.6,该模型内部代号为iris-alpha,预计2026年6月正式发布。其核心参数突破为150万token超长上下文窗口,较前代GPT-5.5提升43%,刷新现有公开大模型上下文容量纪录,可支持超长合同、大型代码库等复杂场景处理。