2026年3月,日本乐天集团发布号称“日本最大、性能最强”的7000亿参数自研大模型乐天AI 3.0,该项目为日本经济产业省GENIAC计划支持的重点研发成果。模型上线后不久,开源社区开发者核查发现其底层架构完全指向中国团队开发的DeepSeek大模型,仅做了日语数据微调,乐天未披露相关来源的操作引发广泛争议。
3月18日,海外开源托管平台GitHub上一条针对乐天AI 3.0的技术核查帖,在24小时内获得了超过1200次转发,迅速引爆全球AI开发者圈层。有开发者下载乐天官方公开的模型权重文件后发现,其核心配置文件config.json中,直接保留了DeepseekV3ForCausalLM的原生架构标识,连基础参数阈值都未做底层修改。
此次陷入争议的乐天AI 3.0,是乐天集团2024年以来投入超过200亿日元研发的核心AI项目,也是日本经济产业省GENIAC计划扶持的首个本土超大规模大模型。在3月12日的发布会上,乐天CEO三木谷浩史曾公开表示,该模型是“日本首款完全自主研发的7000亿参数大模型”,日语理解能力超过GPT-4,未来将全面接入乐天集团的电商、支付、文旅等全场景业务,还将开放API给日本本土中小企业使用。
当时日本科技界普遍将其视为本土大模型追赶全球第一梯队的标志性成果,甚至有日本媒体称其“打破了中美在超大规模大模型领域的垄断”。
就在发布会结束不到一周,开源社区的技术核查就戳破了“完全自研”的宣传泡沫。
参与核查的独立开发者透露,除了配置文件中保留的DeepSeek原生架构名,比对模型输出特征还可以发现,乐天AI 3.0的通用逻辑推理、多语言处理能力和DeepSeek V3完全重合,仅新增了约10%的日语公开语料做了微调,没有任何底层架构层面的自研修改。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
18 小时前
2026年5月15日,百度正式宣布成立百度模型委员会(简称BMC),全面统筹公司大模型全链路研发与落地工作。原基础模型研发部(BMU)、应用模型研发部(AMU)均调整为向BMC汇报,此次架构调整标志着百度大模型战略正式进入技术应用一体化的高效推进阶段,核心团队由顶尖青年研究员与资深工程领袖组成。

18 小时前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。

19 小时前
2026年5月13日,腾讯云正式发布DeepSeek模型升级及切换公告,宣布将于5月22日10时起停止支持DeepSeek-V3-0324、DeepSeek-V3.1-Terminus、DeepSeek-R1-0528三款旧版模型调用,配套推出的升级版本在推理效果、时延等指标上均优于旧版,平台提示现有用户尽快完成迁移以保障服务稳定运行。

19 小时前
2026年5月,全球AI技术测评团队完成了面向软件开发场景的AI Agent专项基准测试,本次测试覆盖市面上17款主流商用、开源AI Agent产品,覆盖代码生成、漏洞修复、架构设计三大核心开发场景,DeepSeek Dev Agent、OpenAI GPT-4o Coding Agent、Code...

19 小时前
2026年5月新一轮AI大模型迭代周期落地,OpenAI推出的GPT-5.5、DeepSeek发布的V4版本、Anthropic更新的Claude Opus 4.7三款产品,从推理成本、响应速度、多模态处理能力多维度升级,可帮助To B类AI服务商通过智能任务路由优化技术栈,最高实现利润率翻倍,直接重构行业成本收益规则。

20 小时前
近日,人工智能企业Anthropic旗下大模型产品Claude正式拿下此前被马斯克创办的xAI旗下Grok列为首要需求的北美核心IDC资源,本次交易涉及的算力规模约合12万块H100芯片当量,将直接支撑Claude 3系列产品下一阶段的迭代与商业化落地,也让全球头部大模型厂商的算力争夺战进入更为白热化的阶段。

20 小时前
近日谷歌被曝拟将新注册免费账号的默认云存储额度下调至5GB,该调整将直接关联Gemini生成式AI服务的免费使用权限。同期OpenAI GPT-5研发进入收尾阶段、DeepSeek上线新代码模型、苹果Apple Intelligence逐步落地全球市场,2025年消费级AI服务的竞争已进入资源绑定的新阶段。

11 天前
近期全球AI赛道动作密集,OpenAI推进GPT-5研发、微软Copilot商业化覆盖超1亿用户、谷歌Gemini多模态能力迭代、苹果Apple Intelligence完成端侧部署适配,国产厂商DeepSeek、Perplexity等也在垂直场景跑出差异化优势,端侧大模型渗透率预计2025年将突破40%,行业已进入技术落地与场景渗透的关键期。