2026年3月18日,心灵鸡汤出版社发起版权侵权诉讼,将苹果、Meta、xAI、谷歌、Anthropic、OpenAI、Perplexity、英伟达等全球顶尖科技巨头列为被告,指控上述企业使用含大量盗版书籍的The Pile数据集训练AI模型,核心争议点为数据集中的Books3模块涉嫌收录海量受版权保护作品。苹果回应称相关数据集仅用于开源研究项目OpenELMs,未应用于核心AI服务Apple Intelligence。
这场几乎覆盖全球所有头部AI参与者的诉讼,再次把AI训练数据的版权灰色地带摆到了台面上。作为全球AI训练领域使用最广泛的开源数据集之一,The Pile由22个不同的文本子集构成,其中专门收录出版书籍的Books3模块,一直是版权争议的焦点——该模块内容全部爬取自民间影子图书馆,其中超过七成内容没有获得版权方授权。
针对本次指控,苹果的回应格外谨慎。其公开声明中明确强调,公司自2024年起就已经全面启动AI训练数据的合规化改造,所有用于商用产品的训练数据均经过版权审核,涉及The Pile数据集的使用仅出现在面向学术圈的OpenELMs开源项目中,该项目从未向普通用户开放,也没有为Apple Intelligence的训练提供任何数据或技术支持。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录