登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

马斯克证实xAI用OpenAI模型训练Grok 模型蒸馏成行业焦点

当地时间2026年4月,xAI创始人埃隆·马斯克在公开证词中确认,旗下人工智能公司开发的大语言模型Grok,训练过程中使用了OpenAI的相关模型输出数据。此次事件将“模型蒸馏”这一争议性技术路径推到台前,当前全球前沿AI实验室正升级防护机制,防范中小竞品违规复制其大模型训练成果。

此次证词出自马斯克与OpenAI的长期诉讼庭审环节,也是xAI首次官方承认Grok的训练数据集包含第三方大模型的输出内容。作为今年以来AI领域关注度最高的知识产权纠纷,双方的争议核心恰好指向了过去三年AI行业半公开的“灰色训练路径”。

随着GPT-4o、Claude 3等千亿参数级前沿大模型的训练成本普遍突破1亿美元门槛,中小AI厂商基本失去了从零训练通用大模型的可能性。这种情况下,通过调用头部大模型的公开API获取问答、推理内容,再将这些内容清洗后作为自有模型的训练数据,就成了性价比极高的选择。行业调研数据显示,2025年全球新推出的120余款参数在100亿以下的大模型中,超过60%都使用了类似的蒸馏训练方式。

模型蒸馏本质上是一种知识迁移技术,其最初的设计目标是将大模型的能力迁移到参数更小的轻量化模型上,降低部署门槛,原本属于行业公认的合法技术路径。

但近两年出现的“黑箱蒸馏”完全变了味:部分厂商不经过头部厂商授权,批量调用API获取输出内容,直接复刻头部模型的知识储备和推理能力,训练成本仅为从头训练的1/15,却能达到头部模型80%以上的能力,本质上属于对头部厂商研发投入的剽窃。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创