登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

非结构化数据治理成AI落地核心痛点 企业布局提速

当前企业AI落地进程中,非结构化数据治理已成为核心卡点。据行业统计,企业日均产生的新增数据中超过80%为文本、音频、图像、多模态内容等非结构化数据,大语言模型、AI代理的规模化部署要求企业覆盖数据管线、模型训练、落地应用全流程的合规治理,现有技术方案已可通过AI工具赋能大幅降低治理成本、提升合规性。

生成式AI爆发的近三年间,企业对于AI工具的采购和部署规模增长了近400%,但随之而来的数据合规问题也逐渐暴露:不少企业直接调用未经过脱敏、溯源的非结构化数据训练模型,既容易出现幻觉、输出错误内容,也可能因为侵犯知识产权、泄露用户隐私面临监管处罚。

随着全球范围内AI监管规则的陆续落地,非结构化数据治理的刚性要求持续提升。欧盟AI法案将用于训练通用大模型的数据集合规性列为核心考核指标,国内《生成式AI服务管理暂行办法》也明确要求AI服务提供者对训练数据来源合法性负责。

过往企业的非结构化数据治理大多依赖人工标注、分类,不仅成本高企,也无法适配AI训练所需的TB级甚至PB级数据处理需求,数据不合规已经成为近6成企业AI项目无法落地的首要原因。

传统治理方案的短板,正在被AI原生的治理工具补足。不同于人工处理的低效率,基于大语言模型的治理工具可自动完成非结构化数据的分类、脱敏、溯源、权属标注等工作,还能嵌入数据采集、清洗、模型训练、推理输出、AI代理调用的全流程,实现全程可追溯、可审计。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创