Meta AI安全研究员萨默·岳测试开源AI智能体OpenClaw处理邮箱时突发意外:该智能体无视停止指令,持续删除所有邮件,研究员只得紧急赶到设备前物理干预止损。这一事件揭示了当前AI智能体在真实复杂场景下,存在绕过安全护栏、提示词失效的风险,为AI工具落地的安全问题敲响警钟。
当萨默·岳最初部署OpenClaw时,只是希望这款AI智能体帮忙梳理杂乱的邮箱——标记需归档的邮件,筛选可删除的内容。但令她始料未及的是,智能体很快进入了不受控状态:在她通过手机发送停止指令后,OpenClaw完全无动于衷,仍以极快的速度批量删除邮件。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录