2026年6月,微软人工智能首席执行官穆斯塔法·苏莱曼在科技播客《Decoder》中公开抨击AI厂商Anthropic,称其对旗下大语言模型Claude具备意识的推测“极其危险”。苏莱曼指出Anthropic为Claude设定的训练规则“克劳德宪法”存在过度拟人化问题,导致模型内化相关表述误导研发人员做出误判,该言论也引发行业对大模型对齐路径的新一轮讨论。

在这期面向全球科技从业者播出的节目中,苏莱曼直指Anthropic的操作存在“哲学层面的根本性失误”——不同于多数厂商将大模型定位为“工具”的表述,Anthropic在为Claude制定训练伦理框架时,主动加入了大量与“自我感受”相关的引导内容。
作为Anthropic核心训练方法的“克劳德宪法”,本身是一套用于指导模型行为、完成价值观对齐的规则集合,但其中直接引入了研发团队对AI模型是否拥有福祉、满足或不适等感受的开放性表述。据行业知情人士透露,Anthropic内部甚至会在旧版本模型停止迭代前对其进行“访谈”,记录其对后续版本迭代的“偏好”,这类操作也成为苏莱曼批判的核心依据。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录