当地时间2026年4月,xAI创始人埃隆·马斯克在公开证词中确认,旗下人工智能公司开发的大语言模型Grok,训练过程中使用了OpenAI的相关模型输出数据。此次事件将“模型蒸馏”这一争议性技术路径推到台前,当前全球前沿AI实验室正升级防护机制,防范中小竞品违规复制其大模型训练成果。
此次证词出自马斯克与OpenAI的长期诉讼庭审环节,也是xAI首次官方承认Grok的训练数据集包含第三方大模型的输出内容。作为今年以来AI领域关注度最高的知识产权纠纷,双方的争议核心恰好指向了过去三年AI行业半公开的“灰色训练路径”。
随着GPT-4o、Claude 3等千亿参数级前沿大模型的训练成本普遍突破1亿美元门槛,中小AI厂商基本失去了从零训练通用大模型的可能性。这种情况下,通过调用头部大模型的公开API获取问答、推理内容,再将这些内容清洗后作为自有模型的训练数据,就成了性价比极高的选择。行业调研数据显示,2025年全球新推出的120余款参数在100亿以下的大模型中,超过60%都使用了类似的蒸馏训练方式。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录