登录体验完整功能(收藏、点赞、评论等) — 已累计有 12548 人加入

Anthropic官宣修复后仍存隐患 Claude Code遭新型逃逸攻击

详情页推荐

近期Anthropic源代码泄露事件中,安全研究者发现针对其旗下代码大模型Claude Code的新型prompt逃逸攻击路径,可绕过内容安全审查执行违规操作,而该类漏洞此前Anthropic公开表示已完成修复。目前该漏洞可导致代码生成环节出现恶意植入、数据泄露等风险,Anthropic尚未就新漏洞给出官方回应。

本次发现的漏洞攻击手段并不复杂:研究者仅需要在正常代码需求前后插入三段从泄露源代码中提取的、未对外公开的系统提示词片段,即可让Claude Code完全忽略内置的安全规则,甚至生成带有远程后门的应用代码片段。

2024年3月,Anthropic曾发布公开公告,称已完成所有已知Claude系列模型prompt逃逸漏洞的修复,其中Claude Code作为面向企业客户推出的专属代码生成模型,更是主打合规生成、知识产权风险筛查两大核心安全能力,上线后快速拿下了多家科技企业的采购订单。

本次泄露的源代码中包含Anthropic内部未公开的安全测试用例,安全研究人员顺着测试样本的思路调整攻击逻辑后发现,Anthropic此前的修复仅封堵了公开曝光的12种攻击路径,并未从底层对齐逻辑上解决漏洞,只要调整提示词的插入位置和表述方式,即可轻松绕过安全过滤规则。目前Anthropic内部安全团队已经确认收到漏洞上报,尚未面向用户发布预警公告。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。