2026年4月,Ted Entertainment、Matt Fisher、Golfholics三家YouTube频道共同发起集体诉讼,指控苹果、亚马逊、OpenAI绕过平台反爬虫机制,非法下载数百万条视频数据用于AI模型训练,争议核心为包含数千万训练样本的Panda-70M数据集,本次诉讼也被视为AI音视频训练数据版权纠纷的标志性案件。
图源: 图像由AI生成随着多模态大模型的技术竞争进入白热化,海量音视频训练数据的需求暴涨,原本处于灰色地带的爬取公开平台内容行为,正在面临越来越明确的合规挑战。
本次诉讼的争议焦点完全集中在**Panda-70M数据集**之上。根据原告方提交的材料,该数据集通过收录视频网址、ID及时间戳的方式,将海量YouTube视频拆分为超过7000万个独立的训练样本,可供AI模型快速学习视频中的画面、声音、叙事逻辑等信息。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录