AI落地效能不及预期数据质量成被低估的核心制约因素

AI创作导航 1 个月前

风向

近日，科技媒体InfoWorld联合商业智能服务商Qlik发布的企业AI落地专项调研显示，当前超6成已布局AI的企业实际应用效能不及预期，其中82%的项目瓶颈并非来自大模型算法缺陷，而是源于底层训练、推理所用数据集的质量不达标。本次报告重点拆解了高质量数据的商业价值，以及企业可落地的数据质量提升路径。

2024年以来，全球企业在生成式AI、智能分析领域的投入同比增速已突破47%，但激增的投入并未换来同等比例的业务增长：不少企业发现，花费百万采购的前沿大模型服务，在内部业务场景的准确率始终徘徊在70%上下，始终无法达到商用落地的要求。

当前多数企业的AI投入结构存在明显偏差，超过70%的AI相关预算被分配给大模型采购、算法团队招聘，仅不到15%的预算用于底层数据治理。很多企业管理者存在认知误区，认为只要用上GPT-4o、Claude 3这类前沿大模型，就能快速实现业务智能化，却忽略了内部业务数据存在的缺失、重复、标注错误、标准不统一等问题。

比如零售企业的用户消费数据如果有30%的重复录入，就算用再好的推荐算法模型，推送的商品匹配度也很难达到预期，反而会消耗用户信任。

Qlik全球首席数据战略官James Fisher在报告中指出，“垃圾进、垃圾出是AI领域的铁律，大模型的推理输出本质是对输入数据规律的提炼，数据质量的上限直接决定了AI应用的上限。”

调研数据显示，如果特定业务场景的训练数据集准确率从90%提升到99%，对应大模型的输出准确率可以提升37%，这一增益远高于迭代算法版本带来的效果。某快消企业此前投入200万上线生成式AI用户运营系统，初期推送转化率仅2.3%，后来仅投入30万完成用户数据的清洗、去重和跨部门打通，同样的模型体系下，推送转化率直接提升到5.7%，投入产出比远超预期。

多数企业的数据质量问题并非缺乏数据，而是数据分散在不同部门的独立系统中，字段标准、统计口径各不相同，根本无法打通作为AI训练的有效素材。

大语言模型人工智能 AI落地数据质量 Qlik

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

Pareto

企业AI解决方案全链路服务商

提示工程指南

提示工程领域专业学习平台

The Double A framework

助力企业AI落地创业务价值

Intelligence Lab

专业AI咨询服务提供商

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

Animate Anything AI

AI在线图片转视频工具

AI Music Gen

免费AI文生带人声音乐工具