2026年7月2日,AI安全研发企业Anthropic宣布重新部署的Claude Fable 5正式面向全球所有用户开放,同时同步披露该模型搭载的两类核心安全机制细节:分别是随模型同步上线的网络安全分类器系统,以及全新迭代的越狱防护框架。作为主打可靠、可解释、可操控AI系统的研发厂商,Anthropic本次公开的安全技术细节为大模型安全落地提供了新的参考路径。

此次Claude Fable 5的重新上线,距离其首次公开测试仅间隔14天,此前该模型因在部分极端测试场景下出现安全边界响应偏差,Anthropic主动暂停了其公开发布通道,优先完成安全机制的迭代优化。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录