2026年4月,AI创业公司Anthropic开发的Claude Mythos AI模型曝出安全事件:这款因网络安全能力过强、被内部判断不适合公开发布的测试模型,被未授权黑客非法获取访问权限。据彭博社报道,事件发生在Anthropic邀请少量企业参与封闭测试阶段,一向以“AI安全优先”为品牌定位的Anthropic,此次事件再次引发行业对大模型安全边界的广泛讨论。
此次入侵事件最让行业意外的,是黑客得手的路径完全没有用到高端的复杂攻击技术。根据披露的信息,黑客团伙首先利用了Anthropic合作方Mercor公司此前泄露的其他模型配置信息,缩小了Claude Mythos测试节点的范围;其次,团伙中有一名成员曾以合同工身份参与Anthropic的模型评估项目,掌握了内部权限设置的逻辑;最终仅靠对访问地址的“有根据猜测”,就成功拿到了模型的访问权限。
业内人士指出,漏洞并非出在模型本身的安全设计,而是测试流程的信息管控疏漏,这是很多AI公司封闭测试阶段容易忽略的盲区。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录