近日微软正式推出开源Agent Governance Toolkit(代理治理工具包),该产品直接对标OWASP评选的十大Agentic AI安全威胁,可在运行阶段遏制提示词注入、AI代理失控、工具权限滥用等常见安全问题,为企业级AI代理应用落地提供了新的安全合规解决方案,填补了智能代理运行态治理的市场空白。
随着生成式AI技术的快速成熟,具备自主决策、工具调用能力的AI代理(Agent)正在成为企业数字化转型的核心工具,从智能客服、内部流程自动化到研发辅助场景,AI代理的落地规模近两年保持了200%以上的年增速。
但快速扩张的背后是安全风险的集中爆发:据全球企业安全联盟2024年上半年的调研数据,超过65%的企业级AI安全事件与AI代理的运行态风险相关,其中未做权限管控的代理调用第三方工具造成的数据泄露、恶意提示词注入引发的代理失控事件占比最高。此前行业普遍采用的静态安全校验方案,无法适配AI代理动态决策的特性,安全治理已经成为AI代理大规模落地的核心瓶颈。
微软此次推出的Agent Governance Toolkit,直接瞄准了行业公认的安全标准OWASP十大AI代理风险,针对每一项风险都设计了对应的实时检测规则。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
35 分钟前
近日,微软宣布调整Office套件的Copilot AI助手交互逻辑,新增悬浮Copilot按钮的手动关闭选项,解决了此前用户反馈的常驻悬浮键遮挡编辑区域、误触率高等问题。作为微软面向办公场景落地的核心AI工具,Copilot目前已覆盖Office全系列办公应用,全球付费企业用户规模已突破3000万,本次功能更新将进一步优化不同使用习惯用户的体验。

4 小时前
近日,AI开源研究机构Nous Research正式发布全新大模型调控技术对比神经元归因(Contrastive Neuron Attribution,简称CNA)。该技术无需进行稀疏自动编码器(SAE)训练,也不需要修改模型权重参数,仅通过消融稀疏MLP电路即可实现对大语言模型行为的精准控制,大幅降低了大模型对齐与功能定向修改的技术门槛与算力成本。

6 小时前
AI搜索企业Perplexity于近期宣布开源供应链安全工具Bumblebee,该工具基于Go语言开发,采用只读架构设计,可在不获取额外权限的前提下,精准扫描开发者端点的供应链包暴露风险,为全球开发团队防范软件供应链攻击提供了轻量化的开源解决方案,上线仅一周便获得GitHub超2000星的社区关注度。

14 小时前
2026年5月,谷歌面向全球全量用户推送搜索产品的AI功能迭代后,被曝出现罕见功能性漏洞:用户在搜索框输入英文关键词“disregard”检索时,会直接导致搜索界面加载失败、功能完全失效。该漏洞已在全球多个地区的PC端、移动端搜索场景复现,目前谷歌官方尚未作出公开回应,也未推送针对性修复补丁。

14 小时前
第三方调研机构PitchBook 2026年一季度数据显示,北美地区AI初创企业对外披露的年度经常性收入(ARR)平均注水率达47%,近6成风险投资机构(VC)对被投企业的营收虚增行为知情甚至主动提供操作指导,此类合谋造星的操作正在快速推高AI赛道估值泡沫,也为后续行业健康发展埋下不小的风险隐患。

1 天前
全球科技巨头Meta近期正式启动基于生成式AI改造Facebook Groups的新项目,推出对标社区平台Reddit的全新兴趣社交产品。该产品集成Meta自研Llama 3大语言模型,首批灰度测试已经覆盖超过1.2亿原有Facebook群组活跃用户,主打AI驱动的内容自动化治理与兴趣匹配功能,意图抢占近年持续升温的垂直兴趣社区赛道。

1 天前
近日Mozilla正式宣布旗下火狐浏览器将启动代号为Project Nova的大规模版本重构项目,计划于2026年下半年逐步向全量用户推送升级。本次升级围绕界面现代化、隐私控制、生产力三大方向优化,最核心的更新是设置页新增全局统一开关,用户可一键关停浏览器内置的当前及未来所有AI相关功能,进一步强化用户对数据隐私的自主控制权。

1 天前
国内头部大模型厂商DeepSeek近期官宣累计融资额突破700亿元,管理层正式对外披露全新战略方向,不再将短期商业化收益作为核心考核目标,集中全部资源攻坚前沿AI技术,其中面向开发者的编程专属大模型DeepSeek Code已进入落地筹备阶段,相关配套的Agent Harness技术团队招聘工作也已全面启动。