2026年以来,伴随大语言模型能力的指数级跃升,全球AI监管逻辑完成从自愿承诺制到发布前强制测试的核心转向。目前英国AI安全研究院(AISI)、美国商务部下属AI标准与创新中心(CAISI)已率先落地相关规则,将过去由厂商自主完成的红队测试改为政府主导的实证性前置评估,标志着AI监管正式进入落地实操阶段。
就在今年5月,多家头部大模型厂商向欧美监管部门提交最新版通用大模型备案时发现,此前仅需附上内部安全测试报告即可上线的流程已正式失效,代之以监管部门指定机构最长达3个月的独立技术测试,未通过评估的模型一律不得面向公众开放。
过去数年,全球AI监管长期处于“软约束”阶段,大模型上线前的安全评估完全由厂商自主完成,普遍采用内部红队测试、自行发布安全报告的模式,相当于“考生给自己打分”,监管侧仅要求厂商承诺符合伦理原则,缺乏实际核验能力。随着大模型生成能力不断提升,其可被用于生成大规模网络攻击代码、高危生化物品制造指引等风险持续凸显,原有的监管模式已完全无法覆盖国家安全层面的防控需求。
当前英国AI安全研究院(AISI)、美国商务部下属AI标准与创新中心(CAISI)已率先完成监管体系的迭代,正式将发布前强制测试列为通用大模型上线的必要条件。与过去空泛的原则管理不同,新的测试规则已形成明确可量化的技术红线:测试方会通过多轮诱导式提问,核验模型是否会输出可直接落地的风险内容,包括钓鱼攻击代码、大规模杀伤性武器制造流程、可引发社会动荡的深度伪造生成方法等,只要触发任意一类风险阈值,模型就无法通过评估。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 分钟前
2026年5月26日全球权威编程榜单Code Arena最新结果显示,阿里巴巴旗下大模型Qwen3.7-Max以1541分位列全球第二,仅次于Anthropic的Claude系列,超过GPT-5.5、Gemini3.5Flash等国际主流模型,标志着中国AI在Agentic Coding、长时程任务领域实现关键技术突破,为国产大模型商业化落地打开新空间。

9 分钟前
2026年5月26日,3D生成AI企业Hyper3D(影眸科技)正式发布新一代生成模型Rodin Gen-2.5。作为全球首款实现千万面级3D生成的商用模型,其可实现4秒生成百万面模型,细节精度可达毛孔、皮肤微结构级别,核心创新自适应思考努力机制可动态分配算力,标志着AI 3D正式迈入生产可用阶段。

1 小时前
2026年5月26日,昆仑万维正式发布高性能Agent模型天工SkyClaw-v1.0及轻量化版本SkyClaw-v1.0-lite。该模型支持百万token超长上下文,针对复杂工具调用、多轮任务执行、代码生成等场景深度优化,综合性能超越Minimax 2.7、DeepSeek等同类产品,标志国产大模型在智能体生态、长文本处理领域取得重要进展。

1 小时前
2026年5月26日,微软研究院正式开源全新网页智能体框架Webwright,该框架摒弃行业主流的截图/DOM点击式技术路径,采用终端优先设计,支持AI直接编写Playwright代码、执行Bash命令完成复杂网页任务,整体代码量仅约1000行,架构极简,可适配OpenAI、Anthropic等主流大模型后端,为网页智能体落地提供了全新技术方案。

1 小时前
近日,YouTube科技频道Fully Buffered完成一项硬核算力测试,在2006年发布的英特尔单核奔腾4 641处理器上,成功运行Meta最新推出的Llama 3.2 3B大模型。本次测试将20年前的古董消费级硬件与当代大语言模型技术结合,刷新了LLM运行的硬件兼容性下限,也让外界直观感受到摩尔定律在AI时代的迭代效率。

1 小时前
AI基础设施服务商Together AI于近期开源全新注意力感知2位KV缓存量化系统OSCAR,该技术可将大语言模型KV缓存的内存占用降低8倍,同时推理精度接近BF16浮点精度水平,大幅降低长上下文大模型的服务部署成本,为长文本生成、多轮对话、长文档解析等大模型落地场景提供了更具性价比的基础设施解决方案。

1 小时前
2026年5月26日,面壁智能联合清华大学、OpenBMB开源社区正式发布并开源低比特大模型训练成果BitCPM-CANN。该成果基于华为昇腾平台原生研发,覆盖0.5B至8B共4个模型尺寸,推理阶段可释放约6倍显存红利,大幅降低大模型端侧运行门槛,将有效推动端侧AI大模型的轻量化落地与商用普及。

1 小时前
2026年5月26日消息,苹果正与谷歌展开深度合作,采用后者为其定制的1.2万亿参数大型语言模型作为下一代Siri的核心算力支撑。该模型参数量是当前主流移动端模型Gemini 3.5 Flash的4倍,有望大幅提升Siri的理解、推理及多模态交互能力,其本地运行效率成为此次升级的核心关注指标。