2026年3月,苹果iPhone 17 Pro成功实现4000亿参数大语言模型本地运行,该机型仅配备12GB LPDDR5X内存,远低于此类模型常规运行所需的200GB内存门槛。本次突破依托Flash-MoE闪存流转技术与混合专家模型架构实现,目前模型生成速度为0.6 token,为端侧超大模型落地提供了全新技术参考路径。
3月23日海外数码开发者社区流出的测试截图显示,一款未开源的4000亿参数稠密大语言模型,在无云端算力支持的前提下,完全依托iPhone 17 Pro本地硬件完成了多轮对话生成,这一结果很快在AI算力圈引发热议。要知道在本次测试之前,消费级电子设备本地可运行的大模型参数上限普遍停留在百亿级,千亿参数模型始终是云端算力专属的技术品类。
按照行业通用的模型运行标准,即便经过4bit量化压缩,4000亿参数级别的大语言模型,运行时也需要至少200GB的内存空间支撑,而iPhone 17 Pro作为消费级旗舰手机,仅配备了12GB LPDDR5X运行内存,硬件配置和模型需求的差距超过16倍。
目前测试版本的模型生成速度仅为0.6 token/s,远低于日常流畅使用所需的10-15 token/s门槛,暂时不具备落地到消费级场景的可能,但本次验证的核心价值,在于首次打破了“千亿参数模型无法脱离云端运行”的行业共识。
本次技术突破主要依托两项底层技术的组合实现,几乎挖尽了消费级硬件的性能潜力:
其一是Flash-MoE闪存流转技术,这套开源技术方案绕过了传统的运行内存限制,允许设备直接从固态硬盘(SSD)向GPU流式传输推理所需的参数数据,相当于把机身存储临时转化为运行内存使用,大幅拉低了大模型对物理内存的要求。
其二是混合专家模型(MoE)架构,基于该架构的大模型在单次推理过程中,仅需要激活不到2%的参数即可完成计算,不需要调用全量模型参数,从软件层面进一步降低了算力消耗。两项技术叠加,才最终实现了12GB内存设备运行4000亿参数模型的效果。
苹果在端侧AI赛道布局已久,此前发布的iOS 18系统就已经实现了多项百亿参数级大模型的本地运行,核心诉求是避免用户数据上传云端,最大程度保护用户隐私,同时降低AI功能的网络延迟。
本次测试的结果也为整个行业提供了新的研发方向:只要优化参数调用逻辑和数据传输路径,消费级硬件的算力潜力仍有巨大的挖掘空间。行业分析师预测,随着闪存读写速度的进一步提升和MoE架构的持续优化,千亿参数大模型在消费级设备上流畅运行,有望在2-3年内成为现实。

13 小时前
2026年3月30日,格隆汇援引界面新闻消息披露,国产大模型厂商月之暗面(Moonshot AI)推出Kimi K2.5大模型仅一个月后,公司年度经常性收入(ARR)正式突破1亿美元,成功跻身全球AI商业化第一梯队。此次亮眼营收印证了思考型大模型在企业端的高变现价值,行业也出现企业客户预付千万美元抢购算力配额的罕见现象。

13 小时前
2026年3月30日,据Readhub报道,被誉为“欧洲版OpenAI”的法国AI初创企业Mistral AI完成8.3亿美元债务融资,这笔资金由7家银行组成的财团提供,将全部投入算力基础设施建设,核心采购计划为1.38万片英伟达顶级AI芯片,旨在强化大模型训练推理能力,打破中美在通用人工智能领域的主导格局,是欧洲AI发力全球竞赛的标志性动作。

14 小时前
2026年3月30日,埃隆·马斯克旗下AI创业公司xAI曝出核心人事变动,公司最后一位联合创始人、原谷歌DeepMind明星工程师Tony Wu确认离职。这意味着xAI2023年成立时招募的12位来自OpenAI、谷歌、微软的顶尖创始成员,在成立不到三年内已全部流失,此事引发业内对xAI技术研发连续性、内部管理的广泛讨论,也折射出当前AI大模型赛道人才争夺的激烈现状。

16 小时前
2026年3月30日,中文大模型权威基准测评SuperCLUE发布2026年3月最新测评结果,本次共有22款国内外主流大模型参评,覆盖六大核心能力维度。测评显示,字节跳动旗下豆包Doubao-Seed-2.0-pro以71.53分拿下国内第一,跻身全球第一梯队,与OpenAI GPT-5.4的分差已缩小至0.95分,小米MiMo在数学推理单项取得顶尖成绩,标志国产大模型进入高速追赶新阶段。

20 小时前
2026年3月30日,国内大模型产品千问正式上线AI打车、AI充话费等一系列“AI办事”新功能,同步启动用户体验官招募计划,3月30日至4月6日期间每日开放100万体验名额,参与者可领取最高17元体验补贴,平台将基于用户反馈优化AI对复杂场景意图的理解与执行能力,推动通用人工智能落地真实生活场景。

20 小时前
2026年3月30日消息,科技巨头谷歌与AI独角兽Anthropic达成里程碑式融资协议,谷歌将投入数十亿美元,为后者建设专属AI数据中心算力基地。此次合作标志着全球AI领域的竞争已从大模型技术研发层面,延伸到底层算力基础设施的布局,算力正成为科技巨头划分AI赛道势力范围的核心筹码。

21 小时前
2026年3月30日披露的合作信息显示,科技巨头谷歌将向AI独角兽Anthropic提供数十亿美元定向融资,专项用于后者租用谷歌数据中心的算力开支。作为OpenAI的核心竞品,Anthropic当前估值已突破3500亿美元,此次合作标志着双方从股权投资到算力基建的绑定进一步深化,凸显算力在大模型竞争中的核心地位。

21 小时前
2026年3月,据知名科技记者马克·古尔曼在《Power On》通讯中的爆料,苹果计划在iOS27系统中推出激进AI策略:一方面深度集成自研Apple Intelligence能力,另一方面向第三方开放Siri与Apple Intelligence底层接口,同时在App Store增设独立AI应用专区,允许用户自由安装第三方AI机器人,以此在全球AI竞赛中缩小与竞品的差距。