OpenAI最新发布的内部推理模型近日完成原创性数学推导,正式推翻数学家保罗·Erdős1946年提出的、悬而未决80年的单位距离几何猜想,项目组本次主动邀请数学家Thomas Bloom等领域权威完成独立交叉验证,这是全球范围内AI首次依靠原生长链推理能力自主攻克核心数学开放难题,标志人工智能正式从检索式解答阶段迈入原创性科研阶段。
2026年5月21日该成果对外公开后,全球离散几何领域的一线学者第一时间获取了完整的千步推导文档,不少研究人员在公开社交平台表示,这套证明的切入视角完全跳出了过去70多年学界围绕该猜想形成的固化研究路径,没有任何此前公开研究成果的痕迹。
七个月前,OpenAI曾因宣称解决多个Erdős系开放问题遭到学术界广泛质疑,不少学者指出当时的输出内容能在已公开的小众会议论文中找到对应片段,本质是检索拼接得到的伪原创结果。
为了彻底规避类似争议,本次项目组从验证环节开始就设置了多重隔离机制:所有受邀的独立验证学者完全无法接触模型的训练数据集,也没有拿到任何推导过程中的中间日志,仅收到模型最终输出的完整证明文档供交叉核验。包括Thomas Bloom在内的所有参与验证的学者最终均公开出具了背书声明,确认整套推导逻辑不存在漏洞。
在此之前,全球所有AI数学相关模型的能力边界,始终被限定在“辅助人类科研”的定位之内——它们可以快速验证人类已经完成推导的定理,可以高效算出复杂方程的中间结果,却永远无法在完全没有前人研究铺垫的知识空白区走出全新路径。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 分钟前
近日网易有道于2026年5月正式推出子曰4.0全模态大模型,以全量开源为核心定位向开发者社区开放全部核心技术资产,其27B参数版本在数理推理任务上达到行业SOTA顶尖水平,同时完成自研翻译引擎的底层重构,有望大幅降低中小开发者的AI落地成本,推动国内全模态大模型生态的普惠化发展。

4 分钟前
2026年5月谷歌正式官宣搜索引擎重大改版,推出由自研Gemini 3.5 Flash大模型驱动的全新智能搜索框,将传统关键词匹配式搜索全面升级为支持多模态交互的对话式体验。本次改革首次将谷歌搜索平台打造为全链路生成式AI工具统一入口,凭借上下文记忆、需求预判等特性,将直接影响全球数十亿用户的日常信息获取习惯。

6 分钟前
2026年5月,谷歌宣布在旗下AI Mode人工智能搜索模式中测试全新广告体系,依托Gemini大模型为赞助商品生成定制化购买理由解释模块,同时上线搭载内置Gemini聊天机器人的交互广告。该更新在谷歌推出支持长对话查询的全新搜索框次日落地,标志着Gemini能力正式全面渗透至谷歌核心商业广告板块,将直接重构搜索场景下的用户消费转化路径。

8 分钟前
2026年5月最新披露消息,美国五角大楼网络作战部门正式组建专项AI工作组,该工作组由国家安全局与网络司令部负责人约书亚·拉德将军在两周前通过内部邮件官宣成立,核心目标是应对当前私营部门AI模型漏洞探测速度超越顶级黑客的安全风险,推动先进AI工具在涉密敏感网络中安全落地,相关部署也将配合白宫正在起草的AI大模型前置强制测试行政命令同步推进。

11 分钟前
2026年,OpenAI、Anthropic、Google三家全球顶级AI厂商先后启动特定岗位扩招计划,引入源自Palantir的前置部署工程师成熟人才体系,瞄准当下大模型向企业端渗透过程中普遍存在的落地适配差、需求响应慢的行业痛点,计划年内将该类岗位团队规模扩充至原有编制的3倍以上,补齐To B服务的最后一公里能力短板。

32 分钟前
国内头部大模型企业月之暗面(Kimi)近期正式启动赴港上市筹备工作,作为行业“AI六小龙”核心成员,企业已向全体股东通报拆除VIE与红筹架构的计划,过去半年累计融资总额达39亿美元,当前整体估值突破200亿美元,有望成为首批登陆港交所的国内原生大模型创业公司。

35 分钟前
企业财务软件龙头Intuit于2026年5月官宣重组计划,将裁减约17%的员工共超3000人,本次调整并非出于财务困境,核心目标是集中资源向AI产品研发与整合环节倾斜,CEO萨桑·古达尔齐表示将通过简化组织架构加速AI战略落地,弥补此前股价跑输标普500的市场差距,带动旗下TurboTax、QuickBooks等核心产品完成全链路智能化迭代。

37 分钟前
持续靠资本输血维持运营的通用大模型赛道近期迎来标志性转折点,总部位于旧金山的AI初创企业Anthropic最新披露,有望在2026年第二季度实现成立以来首个盈利季度,单季度营收达109亿美元,营业利润约5.59亿美元,商业化进度大幅领先OpenAI、xAI等同赛道头部玩家,打破了市场对头部大模型厂商需长期烧钱的固有认知。