2026年3月,比利时布鲁塞尔自由大学发布研究成果显示,OpenAI旗下ChatGPT-5.2(Thinking)成功破解数学家Ran与Teng2024年提出的悬而未决数学猜想,成为首个可独立生成原创数学证明的商用大模型。该突破标志大语言模型能力边界拓展至高逻辑要求的理论数学领域,全新科研模式“氛围证明”也随之进入公众视野。
在过往AI能力评估体系中,纯理论数学研究一直被视作大语言模型难以突破的能力天花板——不同于代码调试、文本创作有明确的对错标准或参考范式,原创数学证明要求研究者具备从零搭建逻辑链、应对多重不确定性的长期推理能力,而这一认知正在被最新的研究成果彻底推翻。
比利时布鲁塞尔自由大学的研究团队在实验中并未向模型输入任何预设的证明路径、参考引理等提示信息,仅完整呈现了Ran与Teng于2024年提出的数学猜想的原始表述,ChatGPT-5.2全程独立完成了证明路径探索、核心逻辑推导、漏洞自查补全的全流程,无人类研究者介入核心逻辑环节。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录