Math公司研发的Gauss AI Agent仅用5天,完成了菲尔兹奖得主Maryna Viazovska 2022年获奖的8维、24维最优球体堆积定理的形式化验证,生成20万行Lean代码,成为史上最大规模单一目的Lean形式化项目,还自主纠正了原论文的一处错误,被学界称为自动形式化领域的ImageNet时刻。
2026年3月,一则来自数学AI领域的消息迅速席卷全球社交平台:一款被学界称为“硅基高斯”的AI Agent仅用5天时间,便完成了原本需要6名顶尖数学家耗时半年才能完成的工作——形式化验证2022年菲尔兹奖得主Maryna Viazovska的核心研究成果。这一成果不仅刷新了数学形式化验证的效率纪录,更引发了全球学界的广泛讨论。
形式化验证是将数学定理转化为计算机可自动校验的代码的过程,此前顶尖团队完成一项菲尔兹奖级成果的形式化验证,往往需要数月甚至数年的专注投入。而Gauss AI Agent仅用5天,就完成了对Maryna Viazovska 2022年菲尔兹奖获奖成果——8维与24维最优球体堆积定理的完整形式化验证。这也是本世纪以来,首次有菲尔兹奖级数学成果被完全形式化验证。
本次验证工作采用了目前主流的形式化验证编程语言Lean,Gauss共生成了超过20万行Lean代码,成为历史上规模最大的单一目的Lean形式化项目。目前,这批代码已全部公开,全球的数学家与AI开发者均可调用参考,为后续的数学形式化研究提供了重要的基础资源。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
6 小时前
2026年以来,美国加州AI算力集群用电需求同比上涨42%,带动全州平均电价上浮18%。此前长期为硅谷度假胜地太浩湖供电的太平洋燃气电力公司合约将于今年年底到期,受AI用电缺口挤压,其续约报价较此前上涨37%,迫使太浩湖市政部门启动新一轮能源供应商招标,优先考虑可稳定供电的清洁能源服务商。

10 小时前
2026年5月15日,人工智能公司xAI正式推出Agentic命令行工具Grok Build早期测试版,该产品定位智能开发助手,可实现项目结构分析、代码编写、错误调试、开发任务自动化等功能,目前仅向SuperGrok Heavy订阅用户开放,用户可通过x.ai/cli申请体验,后续将根据用户反馈快速迭代优化。

10 小时前
AI编码初创企业Cursor于2026年5月宣布启动全球化扩张进程,未来半年将在亚太地区招聘200名技术及市场类员工,新加坡办事处由资深科技高管Simon Green负责。此前该公司已与SpaceX达成重磅合作协议,SpaceX拥有600亿美元收购Cursor的权利,若未触发收购则需支付100亿美元采购其研发成果,充足资金加持下Cursor正加速技术出海落地。

10 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

11 小时前
2026年5月,旧金山AI初创公司depthfirst开发的AI安全分析系统,自主发现潜伏18年的NGINX高危漏洞CVE-2026-42945。该漏洞CVSS评分为9.2,属于严重级别,影响2008年以来发布的NGINX 0.6.27至1.30.0版本,波及全球近三分之一网站,攻击者可利用漏洞实现远程代码执行,目前NGINX官方已发布对应修复补丁。

11 小时前
2026年5月15日,微信官方宣布旗下小程序成长计划正式完成模型层升级,全面接入腾讯混元最新迭代的Hy3 preview大模型,依托后者升级的逻辑推理与上下文理解能力优化开发者智能化开发、运营体验。此前腾讯发布的2026年第一季度财报显示,Hy3 preview调用量持续位居大模型聚合平台OpenRouter榜首,Agent、编程等核心能力均获市场广泛认可。

11 小时前
2026年5月15日,QQ浏览器与腾讯元宝联合发布高考场景专属AI技能,首批上线地区分数线查询、一分一段查询核心功能,同时计划推出行业首个高考咨询师Agent“元宝高考通”。产品整合教育在线·掌上高考官方权威招考数据,旨在解决全国超1300万高考考生志愿填报普遍存在的信息差与数据可信度痛点。

11 小时前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。