登录体验完整功能(收藏、点赞、评论等) — 已累计有 9963 人加入

全球AI监管迎来拐点 发布前强制测试取代自愿承诺制

2026年以来,伴随大语言模型能力的指数级跃升,全球AI监管逻辑完成从自愿承诺制到发布前强制测试的核心转向。目前英国AI安全研究院(AISI)、美国商务部下属AI标准与创新中心(CAISI)已率先落地相关规则,将过去由厂商自主完成的红队测试改为政府主导的实证性前置评估,标志着AI监管正式进入落地实操阶段。

就在今年5月,多家头部大模型厂商向欧美监管部门提交最新版通用大模型备案时发现,此前仅需附上内部安全测试报告即可上线的流程已正式失效,代之以监管部门指定机构最长达3个月的独立技术测试,未通过评估的模型一律不得面向公众开放。

过去数年,全球AI监管长期处于“软约束”阶段,大模型上线前的安全评估完全由厂商自主完成,普遍采用内部红队测试、自行发布安全报告的模式,相当于“考生给自己打分”,监管侧仅要求厂商承诺符合伦理原则,缺乏实际核验能力。随着大模型生成能力不断提升,其可被用于生成大规模网络攻击代码、高危生化物品制造指引等风险持续凸显,原有的监管模式已完全无法覆盖国家安全层面的防控需求。

当前英国AI安全研究院(AISI)、美国商务部下属AI标准与创新中心(CAISI)已率先完成监管体系的迭代,正式将发布前强制测试列为通用大模型上线的必要条件。与过去空泛的原则管理不同,新的测试规则已形成明确可量化的技术红线:测试方会通过多轮诱导式提问,核验模型是否会输出可直接落地的风险内容,包括钓鱼攻击代码、大规模杀伤性武器制造流程、可引发社会动荡的深度伪造生成方法等,只要触发任意一类风险阈值,模型就无法通过评估。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯