登录体验完整功能(收藏、点赞、评论等)

Anthropic指控三家中国AI初创数据违规 中美AI合规冲突凸显

美国AI巨头Anthropic近日指控中国三家AI初创企业DeepSeek、Moonshot AI及MiniMax,通过约2.4万个虚假账号与旗下Claude模型对话超1600万次,涉嫌盗用训练数据违反服务条款。此前OpenAI也曾指出中国企业存在类似数据合规问题,被点名企业暂未回应,事件凸显中美AI领域数据使用规则的核心矛盾。

当大语言模型的训练数据成为决定行业竞争力的核心壁垒,一场围绕数据合规的跨国纠纷正将中美AI产业的深层矛盾摆上台面。

美国AI巨头Anthropic近日抛出的指控内容极具针对性——三家中国AI初创企业DeepSeek、Moonshot AI及MiniMax被指通过2.4万个虚假账号,与Anthropic旗下的Claude大语言模型完成了超1600万次对话,这些对话数据疑似被用于训练各自的自研模型,直接违反了Claude的服务条款。不同于传统的代码抄袭,AI模型的训练数据侵权往往具有隐蔽性:通过批量虚拟账号获取对话数据的方式,很难被平台实时监测。

无独有偶,此前OpenAI也曾公开指出,部分中国AI企业采用混淆式蒸馏法,通过批量生成定制化prompt获取ChatGPT的输出内容,再将这些数据用于自研模型训练,甚至提及此类行为可能涉及国家安全层面的风险。两次跨国指控的指向高度一致,均瞄准了中国AI企业在训练数据采集环节的“灰色操作”。

截至目前,被Anthropic点名的三家企业均未对外作出公开回应。值得注意的是,这三家企业均为国内AI赛道的新锐玩家:DeepSeek以代码大模型见长,Moonshot AI推出了广受关注的通用大模型产品Kimi,MiniMax则主打多模态大模型技术。它们的沉默,实则映射出中美AI领域在数据使用规则上的核心分歧。

美国AI巨头普遍将旗下大语言模型的输出内容界定为受严格保护的商业资产,其服务条款明确禁止第三方将模型对话数据用于训练竞品模型;而中国AI初创企业在发展初期,往往面临高质量中文语料库资源不足的困境,加之全球范围内可公开获取的合规大模型训练数据相对稀缺,部分企业可能因此选择游走在规则的灰色地带。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创