苹果采用知识蒸馏技术实现谷歌Gemini大模型iPhone端侧运行

AI创作导航 1 个月前

风向

2026年3月披露的合作信息显示，苹果与谷歌达成深度授权协议，允许苹果工程师直接访问数据中心内的Gemini全量大模型，通过知识蒸馏技术将云端Gemini转化为适配iPhone的轻量化端侧AI组件。此举既保留了Gemini的推理精度与响应速度，又大幅降低端侧算力需求，将进一步强化苹果端侧AI的用户体验与技术自主性。

2026年3月25日，多家北美科技媒体同步披露了苹果与谷歌达成的AI领域深度合作细节，这一消息打破了此前市场对双方仅停留在API调用层面合作的猜测：苹果工程师获得了直接进入谷歌数据中心、访问Gemini全量模型的权限，其核心目标是通过知识蒸馏技术，将庞大的云端Gemini模型“压缩”为可在iPhone本地运行的轻量化组件。

2024年以来，全球智能手机市场的竞争重心已经从硬件参数转向端侧AI体验，三星、小米、vivo等安卓厂商先后推出了搭载7B、14B参数端侧大模型的旗舰机型，可在本地实现AI生成内容、智能语义理解、实时多语种翻译等功能。而苹果此前推出的iOS 18、iOS 19系统内置的AI功能，因为模型能力有限、多数功能需要云端联网处理，一直被市场诟病落后于安卓阵营。

苹果基础模型团队（AFM）此前也一直在探索自有大模型的研发，但通用大模型的训练需要投入海量算力与数据资源，短期内很难追平谷歌、OpenAI等第一梯队厂商的技术差距，此次与谷歌的深度合作，恰好补上了苹果在基础模型能力上的短板。

知识蒸馏是近年来大模型领域热门的轻量化技术，核心逻辑是将参数规模庞大、推理能力强的“教师模型”的知识迁移到参数更小、运行更快的“学生模型”中，让小模型在特定场景下能够复刻大模型的推理精度，同时大幅降低算力需求。

与此前行业常见的大模型API接入不同，苹果此次获得的是Gemini全量模型的访问权限，工程师可以完整拆解Gemini的运行机制、获取其思维链推理数据，以此作为训练源训练自有端侧模型。据苹果内部测试数据显示，蒸馏后的Gemini端侧模型参数规模仅为原版云端Gemini的3%左右，在日常语义交互、内容生成、信息整理等iPhone高频使用场景下，推理精度与响应速度与原版Gemini的匹配度超过92%。

大语言模型 Gemini 端侧AI 苹果知识蒸馏

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

提示工程指南

提示工程领域专业学习平台

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

Animate Anything AI

AI在线图片转视频工具

AI Music Gen

免费AI文生带人声音乐工具

C Dance AI

多模态AI动作视频生成工具

AI Baby Dance

免费AI宝宝舞蹈视频生成工具

veo 4 AI

AI生成4K电影级视频工具