Math公司研发的Gauss AI Agent仅用5天,完成了菲尔兹奖得主Maryna Viazovska 2022年获奖的8维、24维最优球体堆积定理的形式化验证,生成20万行Lean代码,成为史上最大规模单一目的Lean形式化项目,还自主纠正了原论文的一处错误,被学界称为自动形式化领域的ImageNet时刻。
2026年3月,一则来自数学AI领域的消息迅速席卷全球社交平台:一款被学界称为“硅基高斯”的AI Agent仅用5天时间,便完成了原本需要6名顶尖数学家耗时半年才能完成的工作——形式化验证2022年菲尔兹奖得主Maryna Viazovska的核心研究成果。这一成果不仅刷新了数学形式化验证的效率纪录,更引发了全球学界的广泛讨论。
形式化验证是将数学定理转化为计算机可自动校验的代码的过程,此前顶尖团队完成一项菲尔兹奖级成果的形式化验证,往往需要数月甚至数年的专注投入。而Gauss AI Agent仅用5天,就完成了对Maryna Viazovska 2022年菲尔兹奖获奖成果——8维与24维最优球体堆积定理的完整形式化验证。这也是本世纪以来,首次有菲尔兹奖级数学成果被完全形式化验证。
本次验证工作采用了目前主流的形式化验证编程语言Lean,Gauss共生成了超过20万行Lean代码,成为历史上规模最大的单一目的Lean形式化项目。目前,这批代码已全部公开,全球的数学家与AI开发者均可调用参考,为后续的数学形式化研究提供了重要的基础资源。
更值得关注的是,Gauss在验证过程中并非简单执行既定任务,还自主检测并纠正了原论文中的一处细微逻辑错误。这一细节让这款AI Agent的价值远超“工具”范畴,展现出了主动进行学术校验与优化的能力,填补了此前AI在数学研究辅助领域的一处空白。
该成果一经公布,便在X平台引发了超过10万条相关讨论,多位顶尖数学家将其称为“自动形式化领域的ImageNet时刻”。正如2012年ImageNet竞赛让计算机视觉从实验室走向产业落地,此次突破证明了AI可以高效完成大规模、高复杂度的数学形式化工作,为自动形式化领域的商业化与规模化应用打开了新的想象空间。
除了数学研究领域,这项技术的应用潜力还可以延伸至多个需要高可靠性代码的行业。例如,在航空航天、自动驾驶、医疗设备等领域,形式化验证可以确保软件代码的绝对正确性,避免因逻辑错误引发安全事故。未来,Gauss这类AI Agent或将成为科研人员与工程师的重要辅助工具,大幅提升复杂系统的研发效率与安全性。

14 秒前
2026年3月4日消息,主打AI代理开发的开源项目OpenClaw上线仅两个月,便以空前速度席卷全球技术社区与中文互联网。截至3月1日,其GitHub星标数突破24.1万,创下平台历史最快增长纪录。该项目从技术论坛、小红书延伸至大众媒体快速出圈,引发AI代理赛道广泛讨论,其爆发既依托技术特性,也契合当前AI应用落地的刚需风口。

1 分钟前
2026年3月2日,美团旗下光年之外团队推出其深耕AI赛道两年多来的首款C端AI原生产品Tabbit AI浏览器,本欲打响本地生活巨头的AI工具赛道入局战。但产品上线不足24小时,翻译工具陪读蛙的开发者便在X平台指控其内置翻译功能抄袭,这场高调发布迅速演变为公关危机,引发行业对AI创新边界的热议。

3 分钟前
2025年12月,第三方调研机构QuestMobile发布国内AI原生App市场最新监测数据,豆包月活用户达2.26亿,位居行业首位,其月活量超过DeepSeek、元宝、蚂蚁阿福、千问四款竞品的月活总和,凸显出豆包在该赛道的绝对领先优势,业内预判其领先地位将进一步巩固。

6 分钟前
2026年3月4日,OpenAI正式上线GPT-5.3 Instant大语言模型,针对ChatGPT的交互体验与事实准确性完成双重升级。该模型联网场景下幻觉率降低26.8%,仅依托内部知识作答时幻觉率下降近两成,同时对话语气更平等自然,减少了以往常见的说教与免责声明表述。目前已登陆ChatGPT网页端与应用端,开发者可通过API接入,OpenAI同时预告了性能更强的GPT-5.4版本。

7 分钟前
AI巨头Anthropic近日为开发者命令行工具Claude Code上线语音交互模式,率先在Windows平台开启灰度发布,仅面向5%首批用户抢先体验,未来几周将全球开放。用户输入/voice指令即可用语音下达编程任务,大幅提升开发效率。目前Anthropic年化收入已超25亿美元,周活用户自今年1月以来翻倍,该功能或推动语音编程成为行业标配。

8 分钟前
近期全球AI大模型赛道竞争持续升级,由华为云技术支撑的MiniMax旗下M2.5模型发布一周内调用量突破3.07万亿Tokens,登顶全球榜单,2月年化经常性收入(ARR)达1.5亿美元,仅搭载10B激活参数。同时DeepSeek V4将于下周发布,稀宇科技计划上半年推出MiniMax M3系列,大摩研报称其将通过架构创新解决知识容量瓶颈。

9 分钟前
2026年3月开学季,马云联合阿里、蚂蚁集团核心管理团队齐聚杭州云谷学校,与校方及教师探讨AI技术带来的行业与教育挑战。蔡崇信、吴泳铭等高管罕见集体到场,凸显阿里系已将AI列为核心发展赛道。马云直言AI冲击远超预期,教育需帮助孩子学会与AI共存,此次聚会预示阿里将加速AI布局以应对行业变革。

10 分钟前
近日阿里通义千问(Qwen)技术负责人林俊旸被曝非自愿离职,距其团队发布Qwen3.5小模型系列仅一天。该系列含0.8B到9B四个参数版本,支持视觉理解与推理切换,本地运行仅需7GB内存。林俊旸为阿里最年轻P10级技术专家,曾推动通义千问核心迭代;有爆料称将由Google Gemini非核心成员接任,另有核心成员离职,阿里暂未回应,此事或冲击千问系列布局。