近期斯坦福与耶鲁大学的联合研究显示,OpenAI、谷歌、Meta、Anthropic及xAI等多家科技巨头的大语言模型,对训练数据的记忆量远超行业此前认知。其中谷歌Gemini 2.5可高精度复现《哈利·波特与魔法石》76.8%的内容,直接挑战AI企业声称不存储版权作品的核心抗辩,或将使这些巨头面临重大版权侵权责任,引发行业对合规与隐私问题的广泛担忧。 当研究人员向谷歌Gemini 2.5输入特定引导提示词后,模型输出的文本中,竟有76.8%与《哈利·波特与魔法石》的内容完全吻合——这一来自斯坦福与耶鲁大学联合研究的结论,近期给全球AI巨头们的版权合规问题来了一记“实锤”。 此次研究针对OpenAI、谷歌、Meta、Anthropic及xAI旗下的主流大语言模型展开,测试素材涵盖13部全球畅销文学作品。研究人员通过设计特定提示词引导模型输出,结果显示,多款大模型能生成与版权作品几乎逐字相同的数千字内容,其对训练数据的记忆程度,远超AI行业长期以来声称的“仅学习内容特征、不存储原文”的范畴。 更值得注意的是,这种“记忆复现”并非个别案例,而是在多个巨头模型中均有体现。相关AI及法律专家在...