少找工具,多做创作

号称日本最大自研大模型 乐天AI 3.0陷DeepSeek套壳争议

2026年3月,日本乐天集团发布号称“日本最大、性能最强”的7000亿参数自研大模型乐天AI 3.0,该项目为日本经济产业省GENIAC计划支持的重点研发成果。模型上线后不久,开源社区开发者核查发现其底层架构完全指向中国团队开发的DeepSeek大模型,仅做了日语数据微调,乐天未披露相关来源的操作引发广泛争议。

3月18日,海外开源托管平台GitHub上一条针对乐天AI 3.0的技术核查帖,在24小时内获得了超过1200次转发,迅速引爆全球AI开发者圈层。有开发者下载乐天官方公开的模型权重文件后发现,其核心配置文件config.json中,直接保留了DeepseekV3ForCausalLM的原生架构标识,连基础参数阈值都未做底层修改。

此次陷入争议的乐天AI 3.0,是乐天集团2024年以来投入超过200亿日元研发的核心AI项目,也是日本经济产业省GENIAC计划扶持的首个本土超大规模大模型。在3月12日的发布会上,乐天CEO三木谷浩史曾公开表示,该模型是“日本首款完全自主研发的7000亿参数大模型”,日语理解能力超过GPT-4,未来将全面接入乐天集团的电商、支付、文旅等全场景业务,还将开放API给日本本土中小企业使用。

当时日本科技界普遍将其视为本土大模型追赶全球第一梯队的标志性成果,甚至有日本媒体称其“打破了中美在超大规模大模型领域的垄断”。

就在发布会结束不到一周,开源社区的技术核查就戳破了“完全自研”的宣传泡沫。

参与核查的独立开发者透露,除了配置文件中保留的DeepSeek原生架构名,比对模型输出特征还可以发现,乐天AI 3.0的通用逻辑推理、多语言处理能力和DeepSeek V3完全重合,仅新增了约10%的日语公开语料做了微调,没有任何底层架构层面的自研修改。

更引发争议的是乐天的信息披露操作:其官方新闻稿中仅以“融合全球开源社区技术精华”一笔带过技术来源,完全没有提及DeepSeek的贡献,甚至在模型发布初期还试图删除配置文件中的架构标识,被开发者抓取到修改日志记录后才放弃操作。而DeepSeek的开源协议明确要求,二次分发或基于其模型开发商用产品时,必须明确标注原始技术来源。

此次事件并非个例,近年全球AI产业高速发展的背景下,将开源大模型微调后号称“全自研”的套壳事件屡见不鲜,背后往往绑定着政府补贴、融资估值等现实利益。

本次事件的特殊性在于,作为拿到国家级科研扶持的项目,乐天AI 3.0的“套壳”操作不仅涉及开源协议违约,更引发了日本公众对科研经费使用透明度的质疑。截至发稿,日本经济产业省尚未对此事做出回应,乐天集团仅表示“正在核查技术来源相关问题,后续将发布详细说明”。

有开源社区观察者表示,此次事件也给整个AI产业敲响了警钟:如果开源贡献者的劳动成果得不到基本的尊重和标注,未来将会有更多核心技术团队选择闭源,最终损害的是整个全球AI产业的创新效率。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创