2026年3月18日,心灵鸡汤出版社发起版权侵权诉讼,将苹果、Meta、xAI、谷歌、Anthropic、OpenAI、Perplexity、英伟达等全球顶尖科技巨头列为被告,指控上述企业使用含大量盗版书籍的The Pile数据集训练AI模型,核心争议点为数据集中的Books3模块涉嫌收录海量受版权保护作品。苹果回应称相关数据集仅用于开源研究项目OpenELMs,未应用于核心AI服务Apple Intelligence。
这场几乎覆盖全球所有头部AI参与者的诉讼,再次把AI训练数据的版权灰色地带摆到了台面上。作为全球AI训练领域使用最广泛的开源数据集之一,The Pile由22个不同的文本子集构成,其中专门收录出版书籍的Books3模块,一直是版权争议的焦点——该模块内容全部爬取自民间影子图书馆,其中超过七成内容没有获得版权方授权。
针对本次指控,苹果的回应格外谨慎。其公开声明中明确强调,公司自2024年起就已经全面启动AI训练数据的合规化改造,所有用于商用产品的训练数据均经过版权审核,涉及The Pile数据集的使用仅出现在面向学术圈的OpenELMs开源项目中,该项目从未向普通用户开放,也没有为Apple Intelligence的训练提供任何数据或技术支持。
但法律界的分析并不像苹果声明那样乐观。有知识产权律师指出,当前全球范围内尚未就AI训练数据的“合理使用”边界形成统一司法标准,即便仅用于非商用研究,如果相关研究成果间接为商用模型的迭代提供了参考,依然有可能被判定为侵权。有消息称原告方已经掌握了苹果部分基座模型训练过程中调用过Books3内容的相关证据,苹果的辩护主张能否得到法院支持仍存在较大不确定性。而英伟达被诉的原因则是其开源的NeMo大模型开发框架默认提供了The Pile数据集的一键下载接口,被认定为为侵权行为提供了便利。
事实上,本次诉讼并非AI训练数据版权争议的首次爆发。过去三年间,已有超过200名作家、12家出版社先后对OpenAI、谷歌等企业发起侵权诉讼,索赔总金额超过10亿美元。而本次诉讼将英伟达、苹果等此前较少卷入数据版权纠纷的企业列为被告,也意味着维权方的追责范围正在从模型提供方向全产业链延伸。
在监管和诉讼的双重压力下,头部科技企业已经开始主动调整数据策略。除了苹果在2024年启动的合规数据集项目外,OpenAI、Meta等企业也先后与企鹅兰登、哈珀柯林斯等头部出版集团达成了内容授权协议,为训练数据获取合法版权。据行业机构测算,仅2025年全球AI企业支付的内容版权费用就已经超过37亿美元,同比增长182%。
本次集体诉讼也被业内视为推动AI训练数据确权规则出台的重要契机。有参与相关立法研讨的人士透露,目前中美欧均在加快制定AI训练数据的版权规范,未来可能会明确“商用训练必须获得授权、非商用研究可适用合理使用例外”的核心原则,同时配套建立训练数据溯源、登记的统一标准。
可以预见的是,随着版权规则的清晰,AI训练的“数据红利”时代将逐步结束,靠爬取公开免费数据做模型的路径将难以为继。一方面头部企业的合规成本会进一步上升,另一方面也会催生出专门的AI训练数据交易、确权服务市场,为内容创作者提供新的收益渠道。

3 小时前
2026年3月31日,《麻省理工科技评论》刊发专栏作者Angela Aristidou的专项研究文章指出,已沿用数十年的传统AI基准测试体系已全面失效,单次标准化测试无法匹配当下通用大模型的多场景落地需求,行业需转向更以人为中心、匹配具体应用场景的新型评估方法,为AI产品的真实效用测算提供可落地的参考框架。

5 小时前
2026年3月31日,小米创办人、董事长兼CEO雷军公开披露,旗下自研大模型MiMo-V2-Pro在权威大模型评测平台Text Arena的Model Rank维度跻身全球前五,位列Anthropic、OpenAI、Google之后。该评测采用双盲测试机制,由全球真实用户匿名投票排名,彻底杜绝传统评测常见的刷榜行为,排名含金量远高于常规专项数据集评测结果。

5 小时前
2026年3月31日,大量国行iPhone用户发现系统意外出现Apple Intelligence功能选项,引发落地猜想,但该功能上线不久即被迅速撤回。苹果官方回应称正与中国监管机构积极沟通,寻求百度、阿里等本土AI企业的技术合作方案,在符合数据安全法规的前提下尽快推进AI服务落地,CEO库克此前多次强调中国市场是苹果AI生态的核心组成部分。

5 小时前
2026年3月市场监测数据显示,此前因AI厂商算力需求暴涨持续走高的DRAM内存价格即将迎来回落。核心诱因是OpenAI调整战略缩减开支,此前其曾向三星、SK海力士采购合计90万片DRAM晶圆推高市场缺口,如今其砍单数据中心基建、重估与甲骨文的合作协议,叠加迪士尼等企业放弃AI相关大额投资,直接缓解了内存供给紧张状况。

5 小时前
2026年3月31日,国内头部大模型厂商智谱发布2025年度业绩报告,全年实现营收7.24亿元,同比增长132%,综合毛利率达41%远超行业平均水平。核心增长引擎MaaS API平台年度经常性收入达17亿元,同比暴增60倍。2026年一季度公司将API价格上调83%后未出现客户流失,调用量逆势上行,商业化路径跑通领跑国内AGI赛道。

6 小时前
2026年3月,比利时布鲁塞尔自由大学发布研究成果显示,OpenAI旗下ChatGPT-5.2(Thinking)成功破解数学家Ran与Teng2024年提出的悬而未决数学猜想,成为首个可独立生成原创数学证明的商用大模型。该突破标志大语言模型能力边界拓展至高逻辑要求的理论数学领域,全新科研模式“氛围证明”也随之进入公众视野。

7 小时前
2026年3月31日,DeepMind创始人、“DeepMind之父”德米斯·哈萨比斯公开发声,警告当前在研的超级人工智能存在导致人类灭绝的潜在风险,全球范围内的AI研发竞赛已进入不可逆的失控状态,传统外部治理手段难以实现有效管控,这一表态引发科技界对AI安全窗口期快速收窄的普遍担忧。

7 小时前
2026年3月31日,阿里旗下通义千问系列最新迭代模型Qwen 3.6 Plus Preview正式上线AI模型聚合平台OpenRouter。该版本采用优化后的混合底层架构,支持100万超长上下文处理能力,在逻辑推理、编码、复杂问题解决等场景性能超越前代Qwen 3.5系列,比肩市面顶尖旗舰模型,目前处于限时免费体验阶段。