2026年3月,比利时布鲁塞尔自由大学发布研究成果显示,OpenAI旗下ChatGPT-5.2(Thinking)成功破解数学家Ran与Teng2024年提出的悬而未决数学猜想,成为首个可独立生成原创数学证明的商用大模型。该突破标志大语言模型能力边界拓展至高逻辑要求的理论数学领域,全新科研模式“氛围证明”也随之进入公众视野。
在过往AI能力评估体系中,纯理论数学研究一直被视作大语言模型难以突破的能力天花板——不同于代码调试、文本创作有明确的对错标准或参考范式,原创数学证明要求研究者具备从零搭建逻辑链、应对多重不确定性的长期推理能力,而这一认知正在被最新的研究成果彻底推翻。
比利时布鲁塞尔自由大学的研究团队在实验中并未向模型输入任何预设的证明路径、参考引理等提示信息,仅完整呈现了Ran与Teng于2024年提出的数学猜想的原始表述,ChatGPT-5.2全程独立完成了证明路径探索、核心逻辑推导、漏洞自查补全的全流程,无人类研究者介入核心逻辑环节。
这一结果直接推翻了此前行业普遍认为“大模型仅能作为数学研究辅助工具”的判断。此前大模型在数学领域的应用大多局限于数值计算、已知证明步骤验证、文献整理等辅助性工作,从未具备独立攻克未决前沿数学问题的能力。
研究团队将本次ChatGPT-5.2采用的证明模式命名为“氛围证明(vibe-proving)”,其灵感源自近期开发者圈流行的“氛围编程”——即无需向AI给出分步指令,仅传递核心目标与核心约束,AI即可自主完成所有中间环节的执行与优化。
不同于传统数学研究中数学家需要耗费数月甚至数年时间反复试错寻找证明路径,ChatGPT-5.2完成本次证明仅用了不到72小时,且所有推导步骤均符合数学界的规范表述,经多位领域专家验证不存在逻辑漏洞。相关实验过程的可视化演示图由AI图像生成工具Midjourney提供授权。
该成果发布后迅速引发全球数学界、AI界的广泛讨论。不少学者认为,这一突破预示着基础科学研究的范式正在发生根本性变革:未来数学家可以将更多精力投入到高价值猜想的提出、跨领域理论的融合等创造性工作中,将繁复的推导验证工作交由大模型完成,大幅提升基础科研的产出效率。
不过也有研究者提醒,目前大模型生成的数学证明仍然存在可解释性不足的问题,部分推导步骤的逻辑链路难以被人类研究者完全理解,后续仍需针对大模型的逻辑推理可解释性做进一步优化。未来这一技术还可拓展到理论物理、密码学、量子计算等同样需要高强度逻辑推理的基础科研领域。

24 分钟前
2026年4月2日,基于Java开发的国产开源LLMOps平台Maxkb4j正式发布v2.6.0版本。本次更新在技能扩展、安全鉴权、系统稳定性三大维度完成升级,新增Shell工具集成、Webhook Token鉴权等核心功能,同步升级langchain4j版本,为开发者搭建LLM工作流、开发RAG相关应用提供更强底层支撑。

1 小时前
2026年4月2日,国内民航出行服务平台航旅纵横正式上线AI预订机酒功能,依托AI大模型与AI Agent技术能力,用户仅需通过自然语言输入出行需求,系统即可自动完成机票、酒店的搜索、筛选、推荐全链路操作,无需手动比对勾选,大幅降低用户决策与操作成本,成为垂直领域AI落地业务执行场景的典型样本。

1 小时前
2026年4月消息,中兴通讯与字节跳动联合打造的新一代豆包AI手机正式定档2026年第二季度中晚期发布。双方采用豆包大模型与系统底层深度集成的方案,目标将AI从普通对话工具升级为具备自主行动能力的智能体。此前双方合作的上一代工程机仅投放3万台,二手市场一度被炒至3.6万元,市场期待值极高。

1 小时前
国内AI大模型领军企业阶跃星辰(Stepfun)于2026年4月2日正式发布Step 3.5 Flash系列大模型,该系列针对移动端、高频交互场景深度优化,在保留核心逻辑理解与多模态处理能力的前提下实现毫秒级响应,推理成本大幅降低,目前所有Step Plan付费用户已获得首批体验权限,标志着国产大模型在性能与成本平衡赛道取得新突破。

1 小时前
2026年4月2日,AI大模型厂商Anthropic被曝正为旗下核心产品Claude开发代号为“龙虾”的常驻智能代理Conway。该产品支持独立工作UI、Webhook事件唤醒、浏览器直接操作与代码执行能力,还将推出CNW ZIP自定义扩展标准,开放开发者生态,打破传统AI聊天框的交互局限。

1 小时前
2026年4月2日,百度健康正式发布国内首个面向医生群体的任务型医疗AI产品「有医助理」。该产品基于自研Claw框架,依托数千万级权威医学数据,同时配备五层医疗级数据防护体系,可覆盖检索、学术科研、患者随访等多场景需求,标志着国内医疗AI正式从资料检索阶段迈入深度参与临床、科研执行的新阶段。

1 小时前
2026年4月,谷歌DeepMind首席执行官Demis Hassabis通过社交平台暗示,新一代开源大模型Gemma 4即将正式发布。该模型参数规模达120B,为上代Gemma 3的4倍,采用MoE混合专家架构,激活参数仅15B,有望在民用级显卡实现本地离线运行。谷歌意在借这款产品,从中国厂商主导的开源大模型市场夺回话语权。

2 小时前
2026年4月,联想正式对外展示旗下轻量化AI工具天禧AI Claw,实测数据显示该产品可实现最快1小时完成企业业务场景适配,相比行业平均70%中小企业部署AI需10人天以上的配置周期,效率提升超90%,解决了过往AI工具部署复杂、定制成本高、落地效果不达预期的行业普遍痛点。