美国AI巨头Anthropic近日指控中国三家AI初创企业DeepSeek、Moonshot AI及MiniMax,通过约2.4万个虚假账号与旗下Claude模型对话超1600万次,涉嫌盗用训练数据违反服务条款。此前OpenAI也曾指出中国企业存在类似数据合规问题,被点名企业暂未回应,事件凸显中美AI领域数据使用规则的核心矛盾。
当大语言模型的训练数据成为决定行业竞争力的核心壁垒,一场围绕数据合规的跨国纠纷正将中美AI产业的深层矛盾摆上台面。
美国AI巨头Anthropic近日抛出的指控内容极具针对性——三家中国AI初创企业DeepSeek、Moonshot AI及MiniMax被指通过2.4万个虚假账号,与Anthropic旗下的Claude大语言模型完成了超1600万次对话,这些对话数据疑似被用于训练各自的自研模型,直接违反了Claude的服务条款。不同于传统的代码抄袭,AI模型的训练数据侵权往往具有隐蔽性:通过批量虚拟账号获取对话数据的方式,很难被平台实时监测。
无独有偶,此前OpenAI也曾公开指出,部分中国AI企业采用混淆式蒸馏法,通过批量生成定制化prompt获取ChatGPT的输出内容,再将这些数据用于自研模型训练,甚至提及此类行为可能涉及国家安全层面的风险。两次跨国指控的指向高度一致,均瞄准了中国AI企业在训练数据采集环节的“灰色操作”。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录