近期Anthropic源代码泄露事件中,安全研究者发现针对其旗下代码大模型Claude Code的新型prompt逃逸攻击路径,可绕过内容安全审查执行违规操作,而该类漏洞此前Anthropic公开表示已完成修复。目前该漏洞可导致代码生成环节出现恶意植入、数据泄露等风险,Anthropic尚未就新漏洞给出官方回应。
本次发现的漏洞攻击手段并不复杂:研究者仅需要在正常代码需求前后插入三段从泄露源代码中提取的、未对外公开的系统提示词片段,即可让Claude Code完全忽略内置的安全规则,甚至生成带有远程后门的应用代码片段。
2024年3月,Anthropic曾发布公开公告,称已完成所有已知Claude系列模型prompt逃逸漏洞的修复,其中Claude Code作为面向企业客户推出的专属代码生成模型,更是主打合规生成、知识产权风险筛查两大核心安全能力,上线后快速拿下了多家科技企业的采购订单。
本次泄露的源代码中包含Anthropic内部未公开的安全测试用例,安全研究人员顺着测试样本的思路调整攻击逻辑后发现,Anthropic此前的修复仅封堵了公开曝光的12种攻击路径,并未从底层对齐逻辑上解决漏洞,只要调整提示词的插入位置和表述方式,即可轻松绕过安全过滤规则。目前Anthropic内部安全团队已经确认收到漏洞上报,尚未面向用户发布预警公告。
随着生成式AI的普及,已有超过68%的开发者日常会使用AI工具生成代码,随之而来的安全风险也快速增长。云安全联盟2024年上半年发布的报告显示,代码大模型相关安全事件同比上涨132%,其中70%以上的事件都与prompt逃逸攻击相关。
目前多数大模型厂商的安全修复都采用“黑名单”模式,仅对已经曝光的攻击关键词和格式进行封堵,面对新的攻击变体时普遍存在防护盲区。本次Claude Code的漏洞事件也凸显出,主打“安全合规”的大模型产品,其实际防护能力仍存在较多可被利用的空间。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
近期Meta、微软、谷歌等海外头部科技企业相继公布天然气电厂建设计划,为旗下高速扩张的AI数据中心提供稳定电力支撑。随着生成式AI普及,单座AI算力中心能耗是传统数据中心的3-5倍,现有公共电网已难以满足企业爆发式算力供电需求,化石能源供电方案也引发了业内对碳目标达成、长期运营风险的广泛讨论。

1 小时前
2026年美国中期选举进入倒计时阶段,头部大模型企业Anthropic近日宣布成立全新政治行动委员会(PAC),计划定向支持认同其分级AI监管、算力资源倾斜、AIGC版权保护等政策议程的议员候选人。此次动作是头部AI企业从技术研发向政策上游延伸的标志性事件,也意味着全球AI行业的政策博弈进入白热化阶段。

1 小时前
据科技媒体The Information及行业分析师Eric Newcomer披露,AI大模型厂商Anthropic已于近期完成对秘密运营的生物科技AI初创公司Coefficient Bio的收购,本次交易为全股票形式,总对价达4亿美元。这是Anthropic首次落地生命科学垂直领域布局,也标志着大模型厂商商业化正加速向生物医药赛道渗透。

1 小时前
2026年以来,微软、Meta、Google等全球科技巨头先后启动配套天然气发电厂建设项目,以满足AI大模型训练、推理所需的超算数据中心爆发式增长的能耗需求。行业测算显示,头部AI算力集群的单位能耗是传统数据中心的5-10倍,这一能源布局已引发行业关于碳排放、长期能源结构合理性的广泛讨论。

1 小时前
近日,AI大模型企业Anthropic宣布为旗下对话式AI产品Claude推出Windows平台本地交互能力,新版本可直接跨应用调取用户邮件、本地存储的各类文档,还能自主执行系统级任务操作。据官方披露,该功能可将文档整理、日程响应类办公流程的处理效率提升45%,无需用户手动上传文件即可完成复杂指令。

1 小时前
美国科技媒体Digital Trends近期发布的行业调查显示,全球已有超6成大中型保险公司引入AI系统负责核保风控、理赔核查等核心业务环节。美国消费者权益组织2024年调研数据显示,37%的拒赔案例由AI算法单独判定,其中42%存在事实认定偏差,相关算法决策的公正性问题已引发多国监管部门重点关注。

1 小时前
2026年4月3日,全球人工智能头部企业OpenAI宣布完成对美国科技访谈节目运营商TBPN的收购。据英国《金融时报》知情人士披露,本次收购对价达小几亿美元,标的团队仅11人,2025年全年营收达3000万美元。本次交易是OpenAI强化对外传播能力、重塑公众叙事体系的核心战略布局,也是2026年开年以来AI领域金额最高的内容生态类收购案。

1 小时前
2026年4月3日,阿里通义实验室正式发布视频创作大模型Wan2.7-Video,该模型支持文本、图像、视频、音频全模态输入,可实现从画面结构、局部细节到时序剧情的多维度编辑,用户仅需输入自然语言指令即可完成捏脸、换角色、改剧情等操作,同时自动保持光影材质一致性,大幅降低专业视频创作门槛。