近日微软正式推出开源Agent Governance Toolkit(代理治理工具包),该产品直接对标OWASP评选的十大Agentic AI安全威胁,可在运行阶段遏制提示词注入、AI代理失控、工具权限滥用等常见安全问题,为企业级AI代理应用落地提供了新的安全合规解决方案,填补了智能代理运行态治理的市场空白。
随着生成式AI技术的快速成熟,具备自主决策、工具调用能力的AI代理(Agent)正在成为企业数字化转型的核心工具,从智能客服、内部流程自动化到研发辅助场景,AI代理的落地规模近两年保持了200%以上的年增速。
但快速扩张的背后是安全风险的集中爆发:据全球企业安全联盟2024年上半年的调研数据,超过65%的企业级AI安全事件与AI代理的运行态风险相关,其中未做权限管控的代理调用第三方工具造成的数据泄露、恶意提示词注入引发的代理失控事件占比最高。此前行业普遍采用的静态安全校验方案,无法适配AI代理动态决策的特性,安全治理已经成为AI代理大规模落地的核心瓶颈。
微软此次推出的Agent Governance Toolkit,直接瞄准了行业公认的安全标准OWASP十大AI代理风险,针对每一项风险都设计了对应的实时检测规则。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
国内AI厂商Z.ai近期正式推出开源大模型GLM-5.1,该模型支持AI编码智能体实现连续数小时的无干预自主运行,可完成数百次迭代优化,大幅提升长周期软件开发任务的处理效率。当前全球AI企业正加速布局编码智能体赛道,这款新模型的落地将为开发工具市场提供新的技术参照,也为开源大模型的工业级应用拓展了边界。

1 小时前
2026年4月8日,由中国科学院上海高等研究院牵头打造的全球首个全景式碳排放核算系统“磐石·禹衡”碳核算大模型正式在上海发布。该模型通过数据、算法、算力三位一体架构,搭载208TB自主碳数据集、320亿参数大模型底座及5个专项智能体,破解传统碳核算行业长期存在的多重痛点,实现该领域从跟跑到范式重构的技术跨越。

2 小时前
2026年4月开放数据研究所(ODI)发布的最新研究显示,英国政府2024年秋季预算案确认、投资1亿英镑的国家数据图书馆(NDL)计划,正遭遇公共数据集质量不足的核心挑战。该计划原本预期为AI研发、企业创新提供权威数据支撑,当前却因数据集误导性标题、元数据缺失、标签混乱等问题,落地进程存在较大不确定性。

4 小时前
2026年4月6日,微软GitHub为旗下Copilot CLI推出名为Rubber Duck的跨模型AI代码审查实验性功能,通过引入“第二意见”独立审查机制,支持用户选用Claude系列作为主控模型、GPT-5.4做代码校验,可解决传统AI自我审查的训练偏差问题,经测试AI代码生成性能提升近75%,有效降低开发过程中早期错误累积风险。

5 小时前
2026年4月8日,Google正式宣布将旗下生成式AI大模型Gemini深度集成至Gmail邮箱服务,针对外界对AI处理敏感隐私数据的普遍质疑,Gmail产品副总裁Blake Barnes代表官方作出三项核心隐私承诺,明确Gemini等基础大模型不会使用用户个人邮件内容训练,所有AI处理环节实现数据隔离、权限自动销毁。

5 小时前
2026年4月8日,腾讯正式发布国内首款AI驱动浏览器产品“龙虾QBotClaw”,该产品是国内首个支持主流大模型API自由配置的AI浏览器,打破行业普遍的单一模型绑定规则,内置X5use高精度识别技术,可执行跨页面复杂任务,目前Mac版已上线并集成QQ浏览器Skill,Windows版将于近期推出,核心目标是降低大模型使用门槛。

5 小时前
2026年4月,微软Bing团队正式开源多语言嵌入模型Harrier,该模型基于超20亿真实训练示例及GPT-5合成数据训练,搭载32000词元上下文窗口,27亿参数版本在MTEB v2基准测试中表现优异,支持超100种语言。目前三款不同参数规格的模型已在Hugging Face以MIT许可发布,可适配不同硬件环境的开发需求。

7 小时前
2026年4月,英特尔正式宣布加入埃隆·马斯克旗下Terafab AI芯片项目,与SpaceX、特斯拉、xAI达成四方战略合作,共同推进全球规模领先的半导体制造计划。该项目核心目标为实现每年1太瓦算力产出,集逻辑芯片、存储、先进封装于一体,为下一代AI模型、人形机器人及太空AI系统提供底层算力支撑。