Math公司研发的Gauss AI Agent仅用5天,完成了菲尔兹奖得主Maryna Viazovska 2022年获奖的8维、24维最优球体堆积定理的形式化验证,生成20万行Lean代码,成为史上最大规模单一目的Lean形式化项目,还自主纠正了原论文的一处错误,被学界称为自动形式化领域的ImageNet时刻。
2026年3月,一则来自数学AI领域的消息迅速席卷全球社交平台:一款被学界称为“硅基高斯”的AI Agent仅用5天时间,便完成了原本需要6名顶尖数学家耗时半年才能完成的工作——形式化验证2022年菲尔兹奖得主Maryna Viazovska的核心研究成果。这一成果不仅刷新了数学形式化验证的效率纪录,更引发了全球学界的广泛讨论。
形式化验证是将数学定理转化为计算机可自动校验的代码的过程,此前顶尖团队完成一项菲尔兹奖级成果的形式化验证,往往需要数月甚至数年的专注投入。而Gauss AI Agent仅用5天,就完成了对Maryna Viazovska 2022年菲尔兹奖获奖成果——8维与24维最优球体堆积定理的完整形式化验证。这也是本世纪以来,首次有菲尔兹奖级数学成果被完全形式化验证。
本次验证工作采用了目前主流的形式化验证编程语言Lean,Gauss共生成了超过20万行Lean代码,成为历史上规模最大的单一目的Lean形式化项目。目前,这批代码已全部公开,全球的数学家与AI开发者均可调用参考,为后续的数学形式化研究提供了重要的基础资源。
更值得关注的是,Gauss在验证过程中并非简单执行既定任务,还自主检测并纠正了原论文中的一处细微逻辑错误。这一细节让这款AI Agent的价值远超“工具”范畴,展现出了主动进行学术校验与优化的能力,填补了此前AI在数学研究辅助领域的一处空白。
该成果一经公布,便在X平台引发了超过10万条相关讨论,多位顶尖数学家将其称为“自动形式化领域的ImageNet时刻”。正如2012年ImageNet竞赛让计算机视觉从实验室走向产业落地,此次突破证明了AI可以高效完成大规模、高复杂度的数学形式化工作,为自动形式化领域的商业化与规模化应用打开了新的想象空间。
除了数学研究领域,这项技术的应用潜力还可以延伸至多个需要高可靠性代码的行业。例如,在航空航天、自动驾驶、医疗设备等领域,形式化验证可以确保软件代码的绝对正确性,避免因逻辑错误引发安全事故。未来,Gauss这类AI Agent或将成为科研人员与工程师的重要辅助工具,大幅提升复杂系统的研发效率与安全性。

13 小时前
2026年3月科技巨头Meta宣布收购AI初创公司Moltbook,本次收购核心目标并非升级普通对话式AI机器人,而是提前布局智能体网络(Agentic Web)赛道。业内普遍认为,本次交易将推动Meta探索AI智能体在广告投放、社交电商等场景的商业化落地,为其现有超30亿月活的用户生态提供新的交互与变现路径。

16 小时前
近日,甲骨文(Oracle)正式回应开源社区长期诉求,明确拒绝放弃对关系型数据库MySQL的控制权,同时宣布将提升MySQL社区版开发透明度与参与度,向开源用户开放此前仅商业版专属的7项核心性能优化特性。当前全球活跃MySQL用户超1200万,其中近6成应用于AI相关业务的存储场景,本次调整将直接影响大量AI开发者的技术选型。

17 小时前
科技媒体InfoWorld近期针对2300名全球企业IT负责人的调研显示,68%的受访企业反馈现有AI办公工具的专有平台绑定问题,导致跨团队文档协作效率下降30%以上。主打跨生态兼容、多AI能力调用的开放协作式AI文档解决方案正成为替代方向,可帮助企业显著降低工具锁定成本,提升全链路办公效率。

17 小时前
全球知名科技媒体InfoWorld近期发布行业观察指出,当前智能体编码(Agentic Coding)技术落地速度远超行业预期,具备自主需求拆解、多工具调用能力的AI编码助手已能覆盖70%以上的常规开发场景,仍坚持排斥AI辅助编码的开发者,不仅会大幅降低个人产出效率,也将在未来3-5年的人才市场竞争中处于明显劣势。

17 小时前
2026年3月,谷歌旗下流媒体平台YouTube TV正式在全球范围上线30秒不可跳过广告,本次更新依托Google AI系统实现广告智能调度,可根据用户观看状态动态切换6秒、15秒、30秒不同时长广告,精准捕捉用户高投入度时段提升品牌触达效率,标志着流媒体大屏商业模式正在向传统广播模式靠拢,变现效率有望进一步提升。

21 小时前
2026年3月11日,Diffusion Transformers(DiT)作者、全球AI视觉领域领军人物谢赛宁及其团队正式发布全球首个多人视频世界模型Solaris。该模型基于昆仑天工2025年开源的Matrix-Game2.0架构开发,创新性引入多人自注意力层,目前所属项目种子轮估值已超35亿美元,实现了视频生成模型从单人单视角到多人交互世界的关键跨越。

22 小时前
微软旗下开源编程语言TypeScript近日正式推送6.0版本的发布候选(RC)版本,本次更新新增泛型调用场景下函数表达式的类型检查调整功能,同时官方披露正在推进TypeScript向Go语言重写的底层架构迭代计划。作为当前AI应用开发的主流编程语言,本次升级预计将覆盖全球超千万开发者,显著降低生成式AI应用的开发调试成本。

22 小时前
美国初创公司AgentMail近期完成600万美元种子轮融资,面向AI代理场景推出专用邮箱API平台,支持双向会话、内容解析、线程管理、标签分类、全局搜索与自动回复等全链路邮件处理能力,填补了当前AI智能体对外交互场景的基础设施空白,本轮融资将主要用于技术研发与商业化落地拓展。