2026年3月20日,Meta正式宣布在全球范围内加速部署AI内容执法系统,主打打击恐怖主义、儿童剥削、诈骗等多类违规内容。测试数据显示,该系统成人性骚扰内容检测效率达传统人工团队2倍,错误率降低超60%,每日可识别缓解约5000起诈骗企图,同时同步推出基于Meta AI的7×24小时智能支持助手。
全球社交平台的内容治理难题,正在迎来AI技术给出的新解法。过去十余年间,包括Meta旗下Facebook、Instagram在内的全球社交产品,长期被违规内容泛滥、人工审核成本高企、审核员心理健康受损等问题困扰,仅2025年Meta就因内容审核疏漏收到欧盟地区超过12亿欧元的罚单,技术升级早已迫在眉睫。
此前Meta的内容审核体系以第三方人工审核团队为主,数据显示该类岗位年离职率高达42%,大量审核员因长期接触暴力、色情等极端内容出现心理创伤。同时面对诈骗分子不断迭代的伪装话术、敌对势力动态调整的违规内容传播策略,人工审核的响应速度往往滞后3-7天,大量违规内容在完成大规模传播后才被删除,平台治理始终处于被动状态。
随着欧盟《数字服务法》等监管规则落地,平台对违规内容的处置时效、检测覆盖率要求进一步提升,此前的人工审核模式已经无法满足合规要求,这也成为Meta加速落地AI审核系统的直接动因。
本次上线的AI内容执法系统,是Meta首次将多模态大模型全面应用到全品类内容审核场景,标志着其内容治理逻辑从“人工为主、AI为辅”转向“AI为主、人工兜底”。
在内部测试中,该系统对成人性骚扰内容的检测效率达到传统人工审核团队的2倍,误判率较此前的旧AI审核系统降低超过60%。针对近年高发的身份冒充、账号诈骗问题,系统可通过监测登录位置、密码修改行为、内容发布特征等异常信号,每日识别并拦截约5000起诈骗企图,大幅降低了公众人物、企业官方账号的被盗风险。
按照Meta公布的分工方案,未来AI将承担全部重复内容筛查、高危内容首轮审核等高强度工作,人类审核团队将全面转向后端,负责AI模型训练优化、审核结果评估、用户申诉处理等高复杂度、高风险决策环节,既降低了人工接触极端内容的概率,也将整体审核效率提升了3倍以上。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
11 小时前
2026年4月4日,大模型厂商Anthropic正式官宣生态政策调整:从美国东部时间4月4日15点(北京时间4月5日3点)起,旗下Claude大模型将禁用OpenClaw等第三方工具,用户后续仅能通过额外付费套餐或Claude API Key调用相关工具。该政策将率先在OpenClaw落地,未来覆盖全部第三方工具链,是大模型厂商收紧生态控制权、加速商业化的标志性动作。

12 小时前
2026年4月4日消息,据外媒VentureBeat报道,在2026年RSAC全球顶级网络安全大会上,Cisco、Palo Alto Networks、Cato Networks、CrowdStrike四家头部网安厂商发布AI智能体安全方案,但均未推出企业急需的统一紧急关停功能。当前全球超58万个OpenClaw智能体实例暴露在公网中,现有治理手段仅靠补丁修复,存在极高安全风险。

17 小时前
近期Meta、微软、谷歌等海外头部科技企业相继公布天然气电厂建设计划,为旗下高速扩张的AI数据中心提供稳定电力支撑。随着生成式AI普及,单座AI算力中心能耗是传统数据中心的3-5倍,现有公共电网已难以满足企业爆发式算力供电需求,化石能源供电方案也引发了业内对碳目标达成、长期运营风险的广泛讨论。

18 小时前
据科技媒体The Information及行业分析师Eric Newcomer披露,AI大模型厂商Anthropic已于近期完成对秘密运营的生物科技AI初创公司Coefficient Bio的收购,本次交易为全股票形式,总对价达4亿美元。这是Anthropic首次落地生命科学垂直领域布局,也标志着大模型厂商商业化正加速向生物医药赛道渗透。

18 小时前
2026年以来,微软、Meta、Google等全球科技巨头先后启动配套天然气发电厂建设项目,以满足AI大模型训练、推理所需的超算数据中心爆发式增长的能耗需求。行业测算显示,头部AI算力集群的单位能耗是传统数据中心的5-10倍,这一能源布局已引发行业关于碳排放、长期能源结构合理性的广泛讨论。

18 小时前
近期Anthropic源代码泄露事件中,安全研究者发现针对其旗下代码大模型Claude Code的新型prompt逃逸攻击路径,可绕过内容安全审查执行违规操作,而该类漏洞此前Anthropic公开表示已完成修复。目前该漏洞可导致代码生成环节出现恶意植入、数据泄露等风险,Anthropic尚未就新漏洞给出官方回应。

18 小时前
前Facebook核心内容安全团队成员创立的AI治理服务商Moonbounce于近日完成1200万美元融资,其核心产品AI控制引擎可将平台内容审核政策转化为统一、可预测的AI行为判定标准,解决当前AI时代多模态内容审核标准混乱、一致性差的行业痛点,该笔融资将主要用于技术研发与客户场景拓展。

18 小时前
美国科技媒体Digital Trends近期发布的行业调查显示,全球已有超6成大中型保险公司引入AI系统负责核保风控、理赔核查等核心业务环节。美国消费者权益组织2024年调研数据显示,37%的拒赔案例由AI算法单独判定,其中42%存在事实认定偏差,相关算法决策的公正性问题已引发多国监管部门重点关注。