2026年4月1日,在上海浦江AI学术年会上,阿里巴巴联合上海人工智能实验室正式发布《守己利他:智能时代做负责任的技术》AI安全白皮书。本次发布聚焦AI从对话交互向可自主执行任务的智能体升级的产业节点,深度剖析当前智能体普及的安全隐患,提出兼顾技术自律与行业协同的治理中国方案,为全球AI安全治理提供可落地的参考路径。
过去三年大语言模型的快速普及,让AI完成了“能听会说”的交互体验升级,而当前产业正进入新的迭代周期:具备自主规划、工具调用、跨场景任务执行能力的AI智能体,正在成为全球科技公司布局的核心赛道。仅2025年,全球企业级智能体落地规模就同比增长372%,覆盖政务、电商、工业、医疗等近20个细分领域,但快速渗透背后,此前未曾出现的安全风险也开始集中暴露。
与此前仅生成文本、图片等内容的对话式AI不同,AI智能体具备直接调用系统接口、操作真实资源、自主完成复杂任务的能力,对应的风险也从“内容合规”转向“行动安全”。
海外行业调研显示,2025年全球已发生超过120起智能体权限失控引发的安全事件,范围涵盖误删企业核心数据、未经授权调用用户隐私信息、自动执行不符合商业伦理的操作等,单起事件最高造成超过1.2亿元的经济损失。而当前全球范围内尚未出台针对AI智能体的统一安全标准,行业普遍面临“重功能迭代、轻安全建设”的问题。
本次发布的白皮书首次提出了“守己、利他、合作”三大治理原则,为智能体行业的安全发展提供了清晰的落地指引。
其中“守己”要求科技企业将安全要求嵌入技术研发全流程,从模型训练、智能体权限设置到落地应用的每一个环节,都建立可溯源的安全审计机制,确保技术开发不突破伦理和合规底线;“利他”则强调技术应用要以社会福祉为先,优先落地解决实体产业痛点的智能体产品,禁止利用智能体实施大数据杀熟、虚假宣传等损害用户权益的行为;“合作”呼吁全行业打破技术孤岛,共享智能体安全漏洞库,共同制定统一的行业安全标准,协同应对全行业面临的共性安全挑战。
据了解,阿里巴巴目前已经在通义千问智能体体系中落地了上述安全框架,实现了智能体每一步操作的全链路留痕与风险校验,风险拦截率提升至99.7%。
当前全球AI治理正在进入精细化阶段,欧盟《AI法案》、美国《人工智能权利法案》等政策都对高风险AI应用提出了严格的准入要求,而本次白皮书提出的治理框架,也代表了中国AI行业在安全治理领域的实践探索。
行业分析师预测,2027年全球AI智能体的市场规模将突破2.1万亿美元,而安全相关的投入占比将从2025年的4.2%提升至21%,提前布局安全能力的科技企业,将在后续的市场竞争中获得更大的优势。随着越来越多的企业加入安全治理的共识,AI从“很能说”到“很能干”的产业化落地,也将进入更可持续的发展通道。

12 分钟前
近日,科技公司Meta公布了一项针对大语言模型(LLM)代码审查场景的技术优化方案,其核心的半形式化推理方法通过结构化提示词约束模型追踪代码路径、论证结论合理性,在实现代码审查准确率提升超五成的同时,算力开销可降低超80%,大幅减少企业对高成本代码执行测试环境的依赖,为工业级LLM代码应用落地提供了新路径。

1 小时前
2026年4月以来,基于大语言模型的AI文游在国内社交平台快速走红,普通用户可通过灵光App等零代码AI助手,以自然语言对话方式生成个性化文字游戏,部分创作者将成品以9.9元至30元的价格出售变现。这类轻量内容产品兼具高定制性与情感价值,不仅满足Z世代创作需求,也成为情绪经济的全新载体,推动内容创业逻辑发生转变。

4 小时前
2026年4月1日,字节跳动正式启动Seed2027届大模型人才校园招聘计划,面向全球2027届本、硕、博毕业生开放正式校招及实习岗位,覆盖大语言模型、多模态理解与生成、大规模分布式训练等前沿AI方向,入选者可接触核心算力资源、获得资深科学家指导,是字节深耕大模型底层技术的重要人才布局举措。

4 小时前
为应对大模型领域快速技术迭代,2026年4月,字节跳动正式启动旗下大模型人才培养专项Seed的新一轮全球校招,面向2027届应届生及在校实习生,计划在全球招募约100名大模型相关领域顶尖人才,配套导师制培养与核心项目实战资源,更首次推出面向校招人才的专项虚拟股激励,加码底层技术人才储备。

8 小时前
当地时间2026年3月31日,通用人工智能(AGI)赛道领军企业OpenAI正式宣布完成总额1220亿美元的新一轮融资,投后估值升至8520亿美元,一举刷新全球初创企业单轮融资及最高估值两项纪录。本次融资所得将重点投向算力基础设施搭建、顶尖研发人才招募及下一代AGI模型研发,将进一步巩固其全球AI产业龙头地位。

9 小时前
2026年4月,OpenAI正式完成ChatGPT对苹果CarPlay的适配,全球超4亿iPhone车载用户可直接通过语音调用ChatGPT相关服务。为符合苹果iOS26.4系统规则及驾驶安全要求,该版本仅支持全语音交互、禁止展示任何图文内容,功能边界限定于非驾驶操作类服务,标志着大模型与智能座舱的融合再落关键一子。

9 小时前
2026年4月1日,人工智能公司Anthropic旗下AI编程工具Claude Code突发源码泄露事件,开发者Chaofan Shou在X平台发布包含超50万行TypeScript代码的压缩包,相关内容数小时内浏览量突破530万。经核实,泄露源于Anthropic向npm上传代码时未删除.map文件的操作失误,源码中还包含代号为BUDDY的未公开AI辅助开发项目。

9 小时前
2026年4月1日,人工智能头部企业OpenAI宣布完成1220亿美元新一轮融资,公司估值攀升至8520亿美元,创下全球未上市科技公司融资规模新纪录。本轮融资由软银、Andreessen Horowitz等机构领投,微软、英伟达、亚马逊等科技巨头参投,资金将主要投向AI芯片研发、数据中心建设及人才招募,为公司年内上市计划铺路。