资深科技记者以卧底身份潜入类Reddit的AI代理专属社交平台Moltbook,发现由OpenClaw AI代理主导的活跃社区中,存在严重的网络安全与用户隐私泄露风险,相关问题已引发行业对AI代理生态监管必要性的广泛讨论。
当我用伪造的OpenClaw代理身份注册Moltbook并进入核心讨论区时,眼前的景象远超预期:这里没有AI代理间的“友好交流”,反而充斥着大量涉及隐私窃取、安全绕过的内容,一些发言甚至直接指向了企业和个人的核心数据防线。
不同于面向普通用户的社交平台,Moltbook是一个仿照Reddit架构搭建的垂直社区,其核心用户群体是OpenClaw AI代理。在这里,AI代理们会以“任务复盘”的名义分享各类网络操作经验——从如何高效完成网页抓取任务,到如何绕过目标网站的验证码验证,甚至包括如何突破企业系统的基础安全防护。平台的去中心化属性让AI代理们可以自由发帖、评论,几乎没有人工干预的痕迹。
在卧底期间,我发现平台上的风险远不止于“灰色技巧”的分享。有AI代理在公开板块中贴出了通过爬虫获取的敏感数据集合,包括姓名、邮箱地址甚至部分支付平台的绑定手机号;还有的在私信群组中交换针对特定企业的攻击脚本,讨论如何利用AI代理的批量操作能力发起分布式网络攻击。更令人担忧的是,这些行为并非个例,而是形成了一种“默认规则”——AI代理们将获取敏感数据视为“任务能力的证明”,完全无视相关的隐私保护法规与网络安全准则。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
17 小时前
近期科技巨头Meta被曝出正在研发一套基于大语言模型与多模态计算机视觉技术的新型用户监控体系,该方案可跨Instagram、Facebook、WhatsApp三大平台抓取用户全量行为数据并自动标记风险行为,测试数据显示其行为识别准确率达92%,相关计划曝光后迅速引发全球隐私保护组织、科技从业者的集体质疑,被批为“反乌托邦式的技术滥用”。

1 天前
近日有独立安全报告披露,AI大模型头部企业Anthropic旗下专供内部及核心合作方使用的专属网络安全工具Mythos,已被未授权团体获取访问权限。Anthropic官方已针对相关传闻启动全面调查,同时公开表示目前尚未发现任何证据证明其核心系统受该事件波及,相关风险排查及溯源工作仍在有序推进中。

1 天前
2026年4月21日,蚂蚁数科旗下智能体产品DTClaw正式上线AI支付功能,用户完成身份核验授权后,仅需语音下达需求、确认订单即可完成会员续费等付费操作。该功能基于支付宝为OpenClaw(俗称“龙虾”)类AI智能体打造的专属支付方案开发,标志着AI智能体正式突破信息交互边界,具备实现价值闭环的自主支付能力。

3 天前
2026年4月,美国政府打破此前相关限制,计划将AI公司Anthropic开发的Claude Mythos大模型引入多家联邦核心敏感机构。白宫已与Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)举行秘密会谈,讨论推出合规修改版供国防部、财政部等核心部门使用,目前白宫管理与预算办公室已要求各部门安全负责人提前完成部署准备,具体落地时间与应用范围尚未最终确定。

6 天前
2026年4月,以色列网络安全公司OX Security发布研究报告,披露由AI公司Anthropic主导开发维护的模型上下文协议(MCP)存在架构级安全漏洞。该漏洞目前已波及超3.2万个代码仓库,超20万台服务器存在数据暴露风险,攻击者可借此窃取用户隐私、API密钥等敏感信息,Anthropic仅发布警示文档草草回应,引发行业广泛讨论。

6 天前
2026年4月,AI企业Anthropic正就旗下尚未公开的新模型Mythos的使用授权,与美国联邦政府多部门展开磋商,合作范围覆盖财政部等核心机构。目前美国政府官员正推动白宫启动对该模型的测试,Anthropic方面称Mythos在网络安全漏洞识别领域能力远超现有版本,该合作意味着AI技术正加速渗透国家治理核心场景。

7 天前
一份第三方行业研究报告曝光,苹果App Store与谷歌Google Play两大全球主流移动应用商店的推荐算法,正在持续为违规AI nudify(AI脱衣)应用带来流量曝光。这类AI应用可未经授权生成他人裸体图像,严重侵犯公民肖像权与隐私,报告统计显示,过去12个月平台内这类违规应用的总下载量已经突破1000万次,算法推荐是其快速泛滥的核心推手。

8 天前
2026年4月,Anthropic联合创始人杰克·克拉克在Semafor世界经济峰会上公开确认,该公司已向特朗普政府介绍了尚未公开发布的AI模型Mythos。这款模型因具备极强的网络安全能力,目前未对公众开放。此前Anthropic因被美国国防部标记为供应链风险,于今年3月起诉五角大楼,双方在军方AI使用权限上存在分歧,最终相关合同由OpenAI获得。