2026年4月,AI前沿厂商Anthropic被曝暂缓旗下下一代超大规模大模型Mythos的公开发布计划,官方对外声称此举是为防范模型潜在的网络安全风险、避免互联网生态遭受恶意攻击滥用,但业内随即出现质疑声音,认为其或借安全名义掩盖自身技术迭代不足、维护现有市场份额,相关讨论迅速引发AI产业圈广泛关注。
此前Anthropic曾多次对外预热,Mythos是其耗时两年研发的下一代通用大模型,参数规模较当前市售的Claude 3系列提升4倍,推理速度提升270%,可支持复杂网络渗透测试、全链路代码自动生成等高阶能力,原本定于2026年第二季度正式开启API公测,却在上线前一周突然宣布暂缓。
按照Anthropic官方给出的说明,内部多轮红蓝对抗测试发现,Mythos的高阶代码生成能力可被轻易用于编写未公开的零日漏洞利用工具,即便加入现有对齐防护机制,仍有近32%的概率绕过安全限制输出恶意代码,一旦公开发布,可能被黑灰产用于发起大规模网络攻击,对全球互联网基础设施造成不可逆损害。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录