近日,科技媒体InfoWorld联合商业智能服务商Qlik发布的企业AI落地专项调研显示,当前超6成已布局AI的企业实际应用效能不及预期,其中82%的项目瓶颈并非来自大模型算法缺陷,而是源于底层训练、推理所用数据集的质量不达标。本次报告重点拆解了高质量数据的商业价值,以及企业可落地的数据质量提升路径。
2024年以来,全球企业在生成式AI、智能分析领域的投入同比增速已突破47%,但激增的投入并未换来同等比例的业务增长:不少企业发现,花费百万采购的前沿大模型服务,在内部业务场景的准确率始终徘徊在70%上下,始终无法达到商用落地的要求。
当前多数企业的AI投入结构存在明显偏差,超过70%的AI相关预算被分配给大模型采购、算法团队招聘,仅不到15%的预算用于底层数据治理。很多企业管理者存在认知误区,认为只要用上GPT-4o、Claude 3这类前沿大模型,就能快速实现业务智能化,却忽略了内部业务数据存在的缺失、重复、标注错误、标准不统一等问题。
比如零售企业的用户消费数据如果有30%的重复录入,就算用再好的推荐算法模型,推送的商品匹配度也很难达到预期,反而会消耗用户信任。
Qlik全球首席数据战略官James Fisher在报告中指出,“垃圾进、垃圾出是AI领域的铁律,大模型的推理输出本质是对输入数据规律的提炼,数据质量的上限直接决定了AI应用的上限。”
调研数据显示,如果特定业务场景的训练数据集准确率从90%提升到99%,对应大模型的输出准确率可以提升37%,这一增益远高于迭代算法版本带来的效果。某快消企业此前投入200万上线生成式AI用户运营系统,初期推送转化率仅2.3%,后来仅投入30万完成用户数据的清洗、去重和跨部门打通,同样的模型体系下,推送转化率直接提升到5.7%,投入产出比远超预期。
多数企业的数据质量问题并非缺乏数据,而是数据分散在不同部门的独立系统中,字段标准、统计口径各不相同,根本无法打通作为AI训练的有效素材。
针对企业普遍存在的数据治理难题,本次报告也给出了可落地的执行路径。
首先要从源头建立数据标准体系,统一各部门数据的字段命名、统计口径、录入规则,从采集阶段就减少脏数据的产生;其次要搭建企业级的统一数据中台,在合规前提下实现不同业务系统的数据打通和共享;此外还可以引入AI辅助的数据标注、清洗工具,将传统人工数据治理的成本降低60%以上。
值得注意的是,数据治理并非一次性项目,企业需要将数据质量校验纳入日常运营流程,在各个业务部门设置专职数据专员,定期更新数据规则、排查数据问题,才能持续为AI应用提供高质量的输入素材。
随着大模型技术的快速迭代,未来1-2年通用大模型的能力差距将逐渐缩小,无论是OpenAI的闭源模型还是Meta开源的Llama 3,通用能力都会趋于同质化。这种背景下,企业自身积累的高质量独有业务数据,将成为训练专属AI模型、拉开和竞争对手差距的核心壁垒。
预计到2027年,全球企业在数据治理上的投入占AI总预算的比例会提升到40%以上,数据资产的估值和管理也会成为企业数字化建设的核心板块。

10 小时前
法国人工智能初创公司 Mistral AI 近日宣布完成一笔8.3亿美元的债务融资,资金将专项用于在巴黎郊外建设一座大型数据中心,旨在2026年第二季度投入运营。这一举措标志着欧洲AI生态的关键扩张,旨在应对 生成式AI 竞争激化的全球格局。该交易由多家国际金融机构主导,目标通过本地...

11 小时前
在AI计算需求激增的时代背景下,初创公司Starcloud凭借其创新构想迅速崛起。这家成立于17个月前并通过Y Combinator孵化器快速成长的企业,已成功完成1.7亿美元的A轮融资,成为YC历史上最快达到“独角兽”估值(10亿美元以上)的初创公司。其核心战略聚焦于在近地轨道部署数据中心,旨在利...

12 小时前
2026年3月,北京金山办公软件股份有限公司在武汉召开的2026企业合作伙伴大会上,正式宣布全面开放AI办公生态,将依托核心产品WPS 365构建企业智能知识基座,向渠道合作伙伴开放多赛道资源,推动国内万亿级办公市场从传统功能竞争转向AI生态博弈。最新业绩数据显示,WPS 365相关收入同比大涨65%,成为金山办公AI转型的核心增长引擎。

12 小时前
2026年3月30日,百度旗下基于飞桨(PaddlePaddle)开发的开源光学字符识别(OCR)项目PaddleOCR,正式登顶GitHub Star全球OCR开源项目排名,超越老牌项目Tesseract成为全球关注度最高的OCR开源工具。该项目目前支持80余种主流语言识别,标志着以飞桨为代表的中国深度学习开源框架已具备国际领先的垂直技术影响力。

13 小时前
2026年3月30日,格隆汇援引界面新闻消息披露,国产大模型厂商月之暗面(Moonshot AI)推出Kimi K2.5大模型仅一个月后,公司年度经常性收入(ARR)正式突破1亿美元,成功跻身全球AI商业化第一梯队。此次亮眼营收印证了思考型大模型在企业端的高变现价值,行业也出现企业客户预付千万美元抢购算力配额的罕见现象。

13 小时前
2026年3月30日,据Readhub报道,被誉为“欧洲版OpenAI”的法国AI初创企业Mistral AI完成8.3亿美元债务融资,这笔资金由7家银行组成的财团提供,将全部投入算力基础设施建设,核心采购计划为1.38万片英伟达顶级AI芯片,旨在强化大模型训练推理能力,打破中美在通用人工智能领域的主导格局,是欧洲AI发力全球竞赛的标志性动作。

13 小时前
网络安全厂商Human Security于2026年3月发布《2026年人工智能流量与网络威胁基准报告》,首次明确提出互联网流量结构已发生根本性转折:AI生成的自动化流量正在取代人类,成为网络交互的核心主体。报告数据显示,2025年全球AI驱动流量增长近三倍,增速较人类互联网活动快8倍,其中AI智能体流量同比涨幅高达7851%。

13 小时前
2026年3月30日,爱奇艺正式宣布旗下专业AI智能体平台纳逗Pro开启预商用,这是国内首个步入市场化阶段的影视制作专业智能体。平台接入爱奇艺自研奇智大模型,协同多个主流生成式AI模型,可支持从剧本生成到成片输出的一站式长篇影视创作,2025年底启动内测至今已服务爱奇艺内容团队及多家行业合作伙伴,爱奇艺高级副总裁刘文峰介绍了产品的核心定位。