2026年3月25日,MIT科技评论报道,人工智能初创公司Axiom Math正式推出面向数学研究场景的专用大模型工具,免费向全球数学家开放。该工具可辅助完成定理推导、证明验证、文献关联等多类科研任务,目前已有十余位顶尖数学家参与内测,研发团队称其有望将数学科研效率提升30%以上,但行业对其实际落地效果仍持观望态度。
最近一周,包括菲尔兹奖得主在内的二十余位全球顶尖数学家的个人社交账号、数学专业社群MathOverflow都不约而同出现了关于Axiom Math AI工具的讨论,这款刚上线就刷爆数学科研圈的产品,也让AI+基础科研赛道再次成为行业关注的焦点。
AI在科研领域的落地早已不是新鲜事,DeepMind推出的AlphaFold已经改写了结构生物学的研究范式,AI辅助小分子药物研发也已经进入产业化落地阶段,但作为所有基础学科底层支撑的数学领域,却始终没有成熟的AI工具可用。
此前全球数学科研协会的调研数据显示,数学家平均有42%的工作时间消耗在证明步骤核验、同类研究交叉比对、基础推导验证等重复性劳动上,留给前沿方向探索的时间不足一半。而通用大模型虽然在奥数竞赛、高考数学等标准化测试中表现优异,但面对开放的未解决研究问题时,高频出现的幻觉、编造证明过程等问题,始终无法满足数学研究的高精准要求。
和GPT-4、Claude等通用大模型不同,Axiom Math的训练数据集全部来自经过同行验证的数学学术文献、公开形式化证明库、顶刊发表的过往研究成果,没有引入公开互联网的低质量信息。其核心架构还嵌入了独立的逻辑校验模块,所有输出的推导步骤都要经过Coq、Isabelle等主流形式化验证工具的交叉核验,给出溯源依据后才会呈现给用户,从根源上规避了通用大模型常见的“编造证明过程”的幻觉问题。
内测阶段的反馈显示,这款工具已经可以独立完成基础数论、线性代数领域83%的常规证明推导任务,甚至有来自加州大学伯克利分校的科研团队借助它完成了一个困扰团队半年的小定理的辅助推导。目前该工具已经向所有在职数学家、数学专业博士生免费开放,商用版本仅向企业级科研用户收取授权费用。
不过行业内的质疑声音也不少:有学者指出,目前Axiom Math对代数拓扑、量子数学等前沿交叉领域的适配度还比较低,推导准确率不足40%,也有人担忧过度依赖AI工具会削弱年轻数学家的独立推演能力。
Axiom Math团队接受MIT科技评论采访时透露,接下来他们将和全球Top20高校的数学系、普林斯顿高等研究院等科研机构合作,共建细分数学领域的专属训练数据集,预计2026年底前完成全部基础数学分支的功能覆盖,目标是将数学家的重复性工作占比降到10%以下。
在不少行业观察者看来,AI辅助科研已经从“能用”阶段进入“好用”阶段,数学作为所有理工科的底层基础,一旦专用AI工具实现规模化落地,很可能带动整个基础科研的迭代速度,但这款工具最终能否达到研发团队预期的效果,还需要更长时间的实际应用验证。

2 小时前
当地时间2026年3月30日,有“HBM之父”之称的韩国科学技术院电气与电子工程学院教授金正浩公开对外表态,当前以英伟达GPU为核心的AI芯片体系即将发生根本性变革,未来高带宽内存(HBM)、高带宽闪存(HBF)将成为计算核心,GPU与CPU将退居配角,这一预判也引发全球半导体行业对存算一体架构落地节奏的广泛讨论。

3 小时前
2026年4月,中国信通院基于新发布的《云端OpenClaw基线能力要求》开展首批安全评估,腾讯公司公关总监张军披露,旗下龙虾特攻队系列的WorkBuddy、QClaw、轻量云OpenClaw、云桌面云手机Claw、ClawPro共5款产品全部通过评估,覆盖功能可信、收费可控等五大核心安全维度,为国内AI龙虾类产品落地树立了安全合规标杆。

3 小时前
2026年4月1日消息,高德正式全量开源全球首个基于统一架构的具身操作基座模型ABot-M0。该模型可作为“通用大脑”适配多种形态的具身机器人,在Libero、Libero-Plus等多个权威基准测试中达到SOTA表现,其中在Libero-Plus基准上任务成功率达80.5%,较此前业界标杆方案Pi0提升近30%。

3 小时前
国内大模型厂商智谱日前发布2025年全年业绩公告,全年营收达7.24亿元,同比增长131.9%,经调整净亏损31.82亿元,同比扩大29.1%。其最新推出的GLM-5发布24小时内即获字节、阿里、腾讯等头部大厂接入,国内前10大互联网公司已有9家深度集成GLM系列模型,旗下GLM Coding Plan付费开发者规模突破24.2万。

3 小时前
2026年4月,AI智能体与自动化框架OpenClaw正式发布v2026.3.31版本,俗称“龙虾”框架的该平台首次原生捆绑腾讯QQ机器人作为内置渠道插件。本次更新免去了开发者此前依赖第三方桥接工具的接入流程,实现QQ生态全覆盖,支持多账号配置、安全凭证管理等功能,大幅降低AI智能体接入社交场景的开发门槛。

3 小时前
2026年4月,华为面向内测用户推送HarmonyOS 6负一屏应用「智慧助手·今天」15.0.22.210测试版本,首次接入Claw智能体能力,新增AI任务提醒、晨间简报、AI搜索、通勤动态提醒等多项功能,覆盖日程管理、信息查询、场景化服务等多个日常场景,为鸿蒙生态的端侧AI交互落地新增核心入口。

4 小时前
美国科技巨头Meta近日公布新一代超算级AI数据中心Hyperion的配套能源方案,将新建10座天然气发电厂为其专属供能,整体发电容量达1.2GW,足以覆盖美国南达科他州全州的民生与工业用电需求,该方案也引发行业对AI算力能耗与清洁能源转型路径的广泛讨论。

10 小时前
2026年4月,AI创企Anthropic旗下闭源编程工具Claude Code意外泄露引发行业震荡,项目负责人鲍里斯·切尔尼公开承认团队手动操作部署流程失误导致事故,第三方基于泄露代码推出的平替版本上线后短时间内便斩获GitHub 10万星,Anthropic随后紧急启动下架封杀措施,此次事件也引发行业对闭源AI项目安全管控的广泛讨论。