登录体验完整功能(收藏、点赞、评论等) — 已累计有 9950 人加入

Anthropic拟公开上线最强模型Mythos AI安全治理迎来关键拐点

2026年5月,AI公司Anthropic被曝正推进代号为claude-mythos-1-preview的大模型公开上线。这款今年4月7日推出预览版的模型曾因具备自动化零日漏洞挖掘等过强攻防能力被严格限制,此次开放意味着AI安全治理将从过往防御性限制转向主动式工具化,也引发业内对通用AI网络攻防能力边界的广泛讨论。

近日不少海外开发者在Anthropic公开的后端接口迭代日志中发现,此前仅面向极小范围红队测试开放的Claude Mythos模型,已经新增了公开调用的权限配置字段,这款被雪藏多时的超强模型距离正式上线只剩最后一步。

今年4月7日Claude Mythos预览版推出后,就始终笼罩在安全争议的阴影中。和此前主打通用推理、内容创作的Claude系列模型不同,Mythos的核心能力聚焦于网络攻防领域,而非普通的代码编写。

在内部红队测试中,Mythos被证实能够独立发现并利用主流操作系统、浏览器中的未公开零日漏洞,其在复杂攻击链搭建、漏洞利用代码生成上的表现,比现有旗舰模型Claude Opus 4.7高出两个数量级,无需人工辅助即可完成过去专业安全团队数天的工作量

也正是因为能力过于特殊,Mythos上线后仅对极少数政府网络防御机构、头部企业安全团队开放访问权限,且所有使用者都签署了严格的保密协议,被业内称为Anthropic藏了近一年的“危险底牌”。

过去行业对于这类具备超强攻防能力的大模型,普遍采用“防御性限制”的治理逻辑:严格缩小访问范围、禁止公开能力细节,避免技术被恶意群体利用发起网络攻击。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯