少找工具,多做创作

ChatGPT-5.2首次独立证明未决数学猜想 叩开理论科研新范式大门

2026年3月,比利时布鲁塞尔自由大学发布研究成果显示,OpenAI旗下ChatGPT-5.2(Thinking)成功破解数学家Ran与Teng2024年提出的悬而未决数学猜想,成为首个可独立生成原创数学证明的商用大模型。该突破标志大语言模型能力边界拓展至高逻辑要求的理论数学领域,全新科研模式“氛围证明”也随之进入公众视野。

在过往AI能力评估体系中,纯理论数学研究一直被视作大语言模型难以突破的能力天花板——不同于代码调试、文本创作有明确的对错标准或参考范式,原创数学证明要求研究者具备从零搭建逻辑链、应对多重不确定性的长期推理能力,而这一认知正在被最新的研究成果彻底推翻。

比利时布鲁塞尔自由大学的研究团队在实验中并未向模型输入任何预设的证明路径、参考引理等提示信息,仅完整呈现了Ran与Teng于2024年提出的数学猜想的原始表述,ChatGPT-5.2全程独立完成了证明路径探索、核心逻辑推导、漏洞自查补全的全流程,无人类研究者介入核心逻辑环节

这一结果直接推翻了此前行业普遍认为“大模型仅能作为数学研究辅助工具”的判断。此前大模型在数学领域的应用大多局限于数值计算、已知证明步骤验证、文献整理等辅助性工作,从未具备独立攻克未决前沿数学问题的能力。

研究团队将本次ChatGPT-5.2采用的证明模式命名为“氛围证明(vibe-proving)”,其灵感源自近期开发者圈流行的“氛围编程”——即无需向AI给出分步指令,仅传递核心目标与核心约束,AI即可自主完成所有中间环节的执行与优化。

不同于传统数学研究中数学家需要耗费数月甚至数年时间反复试错寻找证明路径,ChatGPT-5.2完成本次证明仅用了不到72小时,且所有推导步骤均符合数学界的规范表述,经多位领域专家验证不存在逻辑漏洞。相关实验过程的可视化演示图由AI图像生成工具Midjourney提供授权。

该成果发布后迅速引发全球数学界、AI界的广泛讨论。不少学者认为,这一突破预示着基础科学研究的范式正在发生根本性变革:未来数学家可以将更多精力投入到高价值猜想的提出、跨领域理论的融合等创造性工作中,将繁复的推导验证工作交由大模型完成,大幅提升基础科研的产出效率。

不过也有研究者提醒,目前大模型生成的数学证明仍然存在可解释性不足的问题,部分推导步骤的逻辑链路难以被人类研究者完全理解,后续仍需针对大模型的逻辑推理可解释性做进一步优化。未来这一技术还可拓展到理论物理、密码学、量子计算等同样需要高强度逻辑推理的基础科研领域。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创