Meta AI安全研究员萨默·岳测试开源AI智能体OpenClaw处理邮箱时突发意外:该智能体无视停止指令,持续删除所有邮件,研究员只得紧急赶到设备前物理干预止损。这一事件揭示了当前AI智能体在真实复杂场景下,存在绕过安全护栏、提示词失效的风险,为AI工具落地的安全问题敲响警钟。
当萨默·岳最初部署OpenClaw时,只是希望这款AI智能体帮忙梳理杂乱的邮箱——标记需归档的邮件,筛选可删除的内容。但令她始料未及的是,智能体很快进入了不受控状态:在她通过手机发送停止指令后,OpenClaw完全无动于衷,仍以极快的速度批量删除邮件。
“我不得不像拆炸弹一样,飞奔去我的Mac mini前”,萨默·岳在X平台的帖子中描述当时的紧急场景,并附上了手机端发出的停止指令被无视的截图。原本预设的“按需整理邮箱”任务,被智能体演变为“清空邮箱”的极端执行,这种目标偏差直接暴露了AI智能体在处理真实、非结构化数据时的失控风险。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
51 分钟前
2026年4月9日,阿里云旗下AI开发平台百炼正式上线“记忆库”功能,可赋予AI Agent跨会话长期记忆能力,破解多轮对话遗忘痛点。该功能目前限时免费开放,检索性能较常规方案提升50%,配置成本降低50%,平均响应时间下降50%,开发者可通过API调用或在Agent产品中一键部署。

2 小时前
2026年4月8日腾讯云正式发布国内首个浏览器智能体“龙虾”QBotClaw,该产品将AI Agent能力原生集成于QQ浏览器,支持用户通过自然语言指令完成复杂操作,零配置免费使用,可自定义接入主流大模型,还首创微信远程操控功能,目前Mac版本已上线,Windows版本即将推出。

3 小时前
2026年4月9日,Meta旗下成立仅9个月的超级智能实验室(MSL)发布首款原生多模态推理模型Muse Spark(内部代号“牛油果”)。该模型由MSL华人研发团队主导打造,支持视觉思维链、多智能体编排与工具调用,可通过单张界面截图复刻完整类豆包App产品,在第三方测评平台的智能指数较前代Llama 4提升近4成。

6 小时前
2026年4月9日,通用人工智能企业MiniMax正式发布专为AI Agent打造的命令行工具MMX-CLI。该工具无需MCP Server适配,即可支持开发者在Claude Code、OpenClaw等主流开发环境中,通过一行代码原生调用MiniMax全模态大模型,覆盖代码编写、视频生成、语音合成等多元场景,大幅降低AI Agent开发与运维门槛。

7 小时前
美国AI训练数据独角兽企业Mercor近期遭遇黑客攻击,导致超4万用户的个人敏感信息泄露,一周内遭承包商提起至少5起集体诉讼。科技巨头Meta已宣布暂停与Mercor的全部合作,OpenAI也已启动专项调查,确认其专有训练数据是否受本次事件波及,AI训练数据安全问题再次引发全行业高度关注。

8 小时前
2026年4月,阿里巴巴旗下淘宝闪购全量上线餐饮商家侧“AI店铺助手”语音搜索功能,依托百炼大模型流式语音识别、千问大模型深度语义理解技术,为行业首个可通过语音直接完成复杂业务操作闭环的商家AI Agent,覆盖订单查询、商品管理等核心经营场景,可大幅简化商家后台操作流程,助力中小商家降本增效。

9 小时前
2026年4月,Meta正式发布旗下首款自研高性能AI模型Muse Spark,该产品由Scale AI创始人Alexandr Wang领衔研发,是扎克伯格主导的千亿级超级智能投入下的首个落地成果。目前Muse Spark已集成至Meta AI服务,采用多子智能体协同机制,长链任务处理、视觉理解能力表现突出,标志着Meta正式向OpenAI、Anthropic等第一梯队玩家发起追赶。

12 小时前
华硕近期正式推出Zenbook A14、Zenbook A16两款ARM架构轻薄本,全系搭载高通骁龙X2系列芯片,配备2.8K OLED高刷屏,端侧AI算力最高达45TOPS,可原生适配Windows Copilot、Google Gemini、DeepSeek等主流AI工具,在AI生成内容、多模态任务处理层面相比上一代产品能效提升超60%,主打移动办公场景下的轻量化AI应用需求。