微软预警AI推荐投毒攻击 已发现50起恶意案例
曾在搜索引擎时代猖獗的“SEO投毒”,如今在AI应用场景中演化出了新变种。微软安全研究团队近期披露一种名为“AI推荐投毒”的新型攻击技术,目前已监测到50起相关案例。攻击者通过隐藏指令操纵AI推荐或总结功能,可能误导用户、植入恶意信息,这一威胁正在给依赖AI工具的用户和企业带来新的安全挑战。
对于有一定网龄的用户来说,“SEO投毒”或许并不陌生——攻击者曾通过炮制大量低质量内容,将恶意软件或虚假信息与特定关键词绑定,让搜索引擎优先推送这些有害结果,诱使用户中招。而在AI工具成为日常信息处理标配的今天,这一攻击逻辑已经完成了场景迁移,直接瞄准了AI应用的核心功能。
微软安全研究团队在2月10日发布的技术博文中,首次系统性披露了“AI推荐投毒”的攻击细节,目前已监测到全球范围内50起相关恶意案例。与传统SEO投毒针对搜索引擎算法不同,这种新攻击的操作路径更隐蔽:攻击者会将精心设计的隐藏指令嵌入网页、App的AI总结按钮逻辑中,当用户点击“AI总结”获取长文、报告的内容摘要时,这些隐藏指令会通过URL的提示参数,悄悄向AI助手注入预设信息,直接篡改其输出结果。
例如,原本应该客观总结一篇技术教程的AI,可能被操纵成推荐某款伪装成官方工具的恶意软件;或是在总结行业新闻时插入虚假的政策细节,误导用户的投资或决策判断。更值得警惕的是,这种攻击几乎无法被普通用户察觉——用户看不到URL中的隐藏参数,只会看到AI生成的“正常总结结果”,很容易放松警惕,直接采信或按照提示操作。
从影响范围来看,“AI推荐投毒”的威胁远超个人用户:企业若依赖AI工具分析行业报告、竞品动态,被投毒的AI输出可能会干扰战略决策,甚至带来商业损失;教育场景中,学生用AI总结学术资料时,可能接触到被篡改的知识点;而电商平台的AI推荐系统若被攻击,用户则可能被引导至劣质或欺诈性商家。
微软安全研究人员指出,这一攻击的本质是利用了AI系统对输入指令的高敏感性,以及当前多数AI应用对外部输入缺乏严格校验的漏洞。随着越来越多平台将AI总结、推荐功能嵌入网页、文档、客服系统,这类攻击的潜在目标范围还在持续扩大。
针对这一威胁,微软给出的应对建议兼具普适性和针对性:普通用户不要完全依赖AI生成的总结内容,尤其是涉及软件下载、重要信息决策时,务必通过官方渠道或权威信源进行交叉验证;企业则需要优化AI应用的输入校验机制,对外部传入的URL参数进行过滤,同时训练AI模型识别并抵御隐藏指令的干扰。
AI技术的快速普及,正在带来效率提升的同时,也催生了新的安全挑战。“AI推荐投毒”并非孤例,未来或许还会有更多针对AI系统的攻击手段出现。这不仅需要安全研究机构持续监测、披露威胁,也需要用户建立“AI结果并非绝对可信”的认知,共同筑牢AI应用的安全防线。

1 天前
2026年3月31日,全球头部AI安全研发企业Anthropic正式与澳大利亚政府签署合作备忘录(MOU),双方将围绕前沿AI安全技术研究、AI公共服务落地等领域展开深度合作,支撑澳大利亚《国家AI计划》相关目标落地。Anthropic首席执行官Dario Amodei赴堪培拉与澳总理Anthony Albanese会面完成签约,本次合作也是发达国家政企协同推进AI治理的最新实践。

1 天前
2026年3月31日,DeepMind创始人、“DeepMind之父”德米斯·哈萨比斯公开发声,警告当前在研的超级人工智能存在导致人类灭绝的潜在风险,全球范围内的AI研发竞赛已进入不可逆的失控状态,传统外部治理手段难以实现有效管控,这一表态引发科技界对AI安全窗口期快速收窄的普遍担忧。

1 天前
2026年3月31日,全球头部AI网关开发商LiteLLM正式宣布终止与合规服务商Delve的所有合作,将转由竞品机构重新开展安全认证。此前LiteLLM开源版本遭遇凭证窃取恶意攻击,暴露出Delve为其颁发的两项安全认证存在审计失职,甚至涉嫌数据造假、雇佣无资质审计人员,引发全行业对AI基础设施合规体系的信任质疑。

1 天前
美国知名AI网关初创企业LiteLLM于2026年3月正式宣布终止与合规服务商Delve的全部合作。此前LiteLLM曾通过Delve获得两项安全合规认证,上周该公司遭遇大规模凭据窃取恶意软件攻击,经溯源相关安全漏洞与Delve提供的服务存在直接关联,事件已引发AI服务供应链安全的全行业讨论。

2 天前
2026年3月30日,蚂蚁AI安全实验室完成对开源自主智能体框架OpenClaw的专项安全审计,共计发现33个安全漏洞。目前OpenClaw最新的2026.3.28版本已完成8个漏洞的修复,包含1个严重级漏洞、4个高危漏洞与3个中危漏洞。蚂蚁集团表示将持续跟进该项目安全风险,助力AI智能体产业安全落地。

3 天前
2026年3月第三方机构Indagari对2800万美国消费者信用卡交易数据的监测显示,AI创企Anthropic旗下大模型产品Claude的付费订阅用户年内已实现翻倍,增长主要受首席执行官Dario Amodei拒绝将模型用于军事致命用途的安全立场、超级碗营销投放及高阶开发者工具上线三大因素驱动,民用市场订阅量创下历史新高。

5 天前
2026年3月27日,据内部泄露文件显示,AI企业Anthropic旗下新一代大模型Claude Mythos已进入秘密测试阶段。该模型归属Anthropic全新推出的Capybara技术层级,综合性能全面超越此前的行业标杆Claude Opus,是Anthropic发展史上规模最大的技术跃迁之一,相关信息曝光后迅速引发业内对技术迭代与AI安全的双重讨论。

6 天前
AI大模型厂商Anthropic近日宣布为旗下AI编程工具Claude Code新增自动运行模式,该功能配套上线用户权限分级管控机制,可自动识别高风险代码运行操作并触发人工验证流程,测算显示可将编程任务误操作风险降低42%,大幅提升企业级用户批量处理编程、运维类自动化任务的效率与安全性。