登录体验完整功能(收藏、点赞、评论等) — 已累计有 12650 人加入

Anthropic重启Claude Fable 5 同步公开安全防护与越狱框架

详情页推荐

2026年7月2日,AI安全研发企业Anthropic宣布重新部署的Claude Fable 5正式面向全球所有用户开放,同时同步披露该模型搭载的两类核心安全机制细节:分别是随模型同步上线的网络安全分类器系统,以及全新迭代的越狱防护框架。作为主打可靠、可解释、可操控AI系统的研发厂商,Anthropic本次公开的安全技术细节为大模型安全落地提供了新的参考路径。

配图

此次Claude Fable 5的重新上线,距离其首次公开测试仅间隔14天,此前该模型因在部分极端测试场景下出现安全边界响应偏差,Anthropic主动暂停了其公开发布通道,优先完成安全机制的迭代优化。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。