Anthropic旗下大模型Claude近日实现重大突破:仅通过31步逻辑推导,独立攻克了一道悬而未决的图论猜想难题。这一成果引发全球科技界震动,计算机科学泰斗、《计算机程序设计艺术》作者高德纳专门发文表达震惊与赞叹,标志着AI在自动推理及创造性数学问题解决领域抵达全新里程碑。
当计算机科学泰斗高德纳罕见公开发文,用“震惊”形容某一项AI成果时,整个科技圈都意识到,这不是一次普通的技术迭代,而是AI在核心能力边界上的又一次跨越。
图论猜想一直是数学领域中极具挑战性的研究方向,这类问题不仅需要扎实的理论基础,更要求研究者具备突破常规的创造性思维能力。此前,AI在数学领域的贡献多集中在计算验证、公式推导辅助等环节,鲜少能独立攻克未经证明的猜想。
而Claude此次仅用31步完整逻辑链,就完成了对目标图论猜想的严谨证明,每一步推导都符合数学逻辑的严谨性,甚至在关键步骤中展现出人类数学家未必能快速想到的巧妙思路。这一成果打破了外界对“AI只能做重复性任务”的刻板印象,证明大语言模型在复杂逻辑推理和创造性问题解决上的潜力远超预期。
高德纳的反应之所以分量十足,源于他在计算机科学领域不可撼动的地位——作为《计算机程序设计艺术》的作者,他的著作被视为该领域的“圣经”,其观点几乎代表了行业的风向标。
此次他专门针对Claude的成果发文,毫不掩饰自己的震惊,甚至直言“从未想过AI能在如此复杂的数学推理中表现得如此出色”。这种来自顶级学者的公开认可,不仅为Claude的成果赋予了学术层面的权威性,更标志着AI在数学推理领域的突破,正式从实验室的技术演示,升级为被行业权威认可的里程碑事件。
Claude的这次突破,留给科技界的思考远不止“AI能解数学题”这么简单。未来,AI或许会成为数学家的核心协作工具:从猜想提出初期的方向预判,到证明过程中的思路拓展,再到验证环节的快速排查,AI都能提供高效支持。
更具想象空间的是,随着AI推理能力的持续进化,或许会有越来越多悬而未决的数学猜想被AI攻克,甚至催生出全新的数学分支理论。而数学领域的突破,又将进一步推动密码学、计算机算法优化、量子计算等多个关联领域的技术升级,形成连锁式的创新效应。

58 分钟前
据科技媒体The Information爆料,OpenAI计划推出新一代大语言模型GPT-5.4,其上下文窗口容量将突破100万Tokens,较前代GPT-5.2的40万Tokens实现翻倍式提升。此外,GPT-5.4新增“极限推理模式”,可针对复杂问题分配更多计算资源,进一步强化模型推理能力,旨在缩小与谷歌、Anthropic竞品的上下文能力差距。

59 分钟前
近日,Meta正式组建应用人工智能工程部门,由现实实验室副总裁Maher Saba掌舵,直接向首席技术官Andrew Bosworth汇报。该部门将与Meta超级智能实验室协作打造模型迭代数据引擎,采用管理者与员工比例最高1:50的扁平化架构,对标英伟达高效模式,有望大幅加速其超级智能研发进程。

1 小时前
据内部知情人士透露,Meta正组建全新应用AI工程部门,由现实实验室副总裁Maher Saba领衔,直接向首席技术官Andrew Bosworth汇报。该部门下设工具开发与数据支持两大核心团队,目标打造“数据引擎”加速大模型迭代,内部管理者与员工比例最高可达1:50,深度践行扎克伯格近期强调的扁平化组织理念,全力推进超级智能研发进程。

1 小时前
字节火山引擎近日正式公布旗下多模态视频生成AI模型Doubao-Seedance-2.0的API服务定价,其中视频输入类(编辑)服务为28元/百万Tokens,纯视频生成服务为46元/百万Tokens。作为豆包大模型团队推出的新一代产品,Seedance 2.0支持图像、视频、音频等多模态输入,此次定价明确标志着其商业化落地的关键一步。

1 小时前
3月4日消息,韩媒披露特斯拉采购高管本周将赴韩拜访三星电子,磋商大幅提升其2nm工艺AI6芯片的产能规模。此前特斯拉向三星晶圆代工的月投片量约1.6万片晶圆,当前额外需求达2.4万片。作为特斯拉定位的通用型AI芯片,AI6可支撑其电动车、人形机器人及数据中心等多元业务的算力需求。

1 小时前
Reddit用户RatonVaquero所属的软件开发公司因谷歌Gemini API密钥被盗,48小时内产生超8.2万美元的天价使用费用,远超其每月180美元的常规开销。该开发者指责谷歌缺乏异常消费冻结、消费上限等防护机制,目前已向FBI报案,寄望谷歌能基于善意减免费用,避免公司陷入破产危机。

1 小时前
继与美国国防部达成合作后,OpenAI正洽谈将AI技术部署至北约非机密网络。CEO山姆·奥尔特曼坦言此举短期内可能引发品牌危机,但仍认为是“复杂但正确的决定”。其竞争对手Anthropic此前因反对AI用于大规模监控和自主武器,已终止与美国国防部的合作。

1 小时前
前Meta研究工程师在被公司裁员后,发起了一场极具趣味性的编程实验:让小狗随机敲击键盘生成无逻辑乱码,再借助Anthropic的大语言模型Claude,将这些乱码转化为可正常运行的网页小游戏,目前已将项目代码全面开源,为AI辅助创意编程领域提供了荒诞却极具启发的新实践。