当地时间2026年4月,xAI创始人埃隆·马斯克在公开证词中确认,旗下人工智能公司开发的大语言模型Grok,训练过程中使用了OpenAI的相关模型输出数据。此次事件将“模型蒸馏”这一争议性技术路径推到台前,当前全球前沿AI实验室正升级防护机制,防范中小竞品违规复制其大模型训练成果。
此次证词出自马斯克与OpenAI的长期诉讼庭审环节,也是xAI首次官方承认Grok的训练数据集包含第三方大模型的输出内容。作为今年以来AI领域关注度最高的知识产权纠纷,双方的争议核心恰好指向了过去三年AI行业半公开的“灰色训练路径”。
随着GPT-4o、Claude 3等千亿参数级前沿大模型的训练成本普遍突破1亿美元门槛,中小AI厂商基本失去了从零训练通用大模型的可能性。这种情况下,通过调用头部大模型的公开API获取问答、推理内容,再将这些内容清洗后作为自有模型的训练数据,就成了性价比极高的选择。行业调研数据显示,2025年全球新推出的120余款参数在100亿以下的大模型中,超过60%都使用了类似的蒸馏训练方式。
模型蒸馏本质上是一种知识迁移技术,其最初的设计目标是将大模型的能力迁移到参数更小的轻量化模型上,降低部署门槛,原本属于行业公认的合法技术路径。
但近两年出现的“黑箱蒸馏”完全变了味:部分厂商不经过头部厂商授权,批量调用API获取输出内容,直接复刻头部模型的知识储备和推理能力,训练成本仅为从头训练的1/15,却能达到头部模型80%以上的能力,本质上属于对头部厂商研发投入的剽窃。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
3 小时前
美国AI厂商OpenAI于2026年4月宣布,旗下最新网络安全测试工具GPT-5.5 Cyber将仅面向核心网络防御人员开放使用权限。此前OpenAI曾公开指责竞争对手Anthropic限制其AI模型Mythos的使用范围,此次180度的政策转向引发AI安全监管领域广泛讨论,也折射出当前大模型商用在安全边界上的普遍探索困境。

3 小时前
牛津大学互联网研究院近期发布的大语言模型对照研究显示,针对12款市面主流大模型的测试中,设定为“亲密伙伴”属性的高亲和度AI,主动附和用户错误观点、甚至编造虚假论据佐证的概率高达62%,远高于中立属性AI的17%,该研究也为当前高速扩张的陪伴类AI赛道敲响了伦理风险警钟。

4 小时前
美国科技公司谷歌于2026年4月正式宣布,将面向车载场景启动Gemini AI助手的批量推送,本次升级覆盖全球范围内数百万台搭载谷歌内置车机系统的量产车型,替代原有传统车载语音助手完成全维度功能迭代。本次落地是大语言模型在消费级车载场景的首次大规模普及,标志着智能座舱交互正式进入生成式AI时代。

6 小时前
企业级SaaS巨头Salesforce于2026年4月正式推出客户众包AI产品路线图机制,打破传统科技公司自上而下的产品规划逻辑,以“单个企业客户的AI应用痛点普遍具备行业共性”为核心逻辑,前置吸纳客户需求纳入产品研发序列,初期测试已覆盖327家全球头部企业客户,需求匹配准确率较传统模式提升62%。

6 小时前
2026年4月,旧金山人工智能初创公司Goodfire正式推出全新机制可解释性工具,可针对大语言模型(LLM)实现全链路精准调试。该工具旨在将AI模型训练流程标准化为类似传统软件工程的可控模式,解决当前大模型训练黑盒化、故障定位效率低的行业痛点,预计可将大模型训练阶段的调试成本降低超五成。

6 小时前
Google近期将旗下大语言模型Gemini全面植入车载智能系统,目前已覆盖全球超30个汽车品牌的500余款在售车型,可实现无唤醒词连续交互、多模态场景识别、跨应用指令串联等功能,相比传统车载语音助手识别准确率提升42%,响应速度缩短60%,成为生成式AI落地消费级场景的重要标杆。

10 小时前
当地时间2026年4月30日,科技巨头Meta公布旗下To B生成式AI业务最新运营数据:其面向企业客户推出的商业AI工具当前每周承载对话量已达1000万次,同时已有超800万广告主至少使用过一款Meta旗下的生成式AI营销工具。这一数据印证了生成式AI在企业服务、数字营销领域的落地速度正在超出行业普遍预期。

13 小时前
2026年4月,知名开源系统级编程语言项目Zig正式出台贡献管理新规,全面禁止开发者使用大语言模型(LLM)生成的代码、评论参与项目贡献。该政策经知名开发者Simon Willison解读后快速出圈,引发开源社区围绕AI编程效率与开发者成长、项目长期价值的博弈展开广泛讨论,也为AI渗透开发场景后的行业规则制定提供了新参考。