在2026年WWDC开发者大会上,苹果联合LM Studio完成技术演示,仅用四台Mac Studio组成的本地集群,就成功运行月之暗面发布的万亿参数大模型Kimi K2.6。该模型采用MoE架构,总参数达1万亿、激活参数320亿,本次验证打破了此前万亿级大模型必须依赖云端GPU集群的固有认知,为消费级硬件承载前沿AI算力提供了可行路径。
WWDC2026最后一日的技术专场演示环节,当Kimi K2.6的多模态推理结果流畅出现在演示屏幕上时,台下开发者群体率先响起掌声——支撑这个万亿参数大模型运行的,既不是动辄数十卡的云端A100集群,也不是专用超算硬件,而是四台消费者可以直接买到的顶配Mac Studio。
此前行业普遍形成共识:百亿参数级大模型可在消费级硬件本地运行,而千亿、万亿参数的前沿大模型必须依赖云端GPU集群部署。这一限制直接推高了大模型的应用门槛:不仅企业需要承担高额的云端算力租赁成本,涉及核心数据的推理请求也存在泄露风险,对数据合规要求较高的医疗、金融等场景,大模型落地一直存在明显阻碍。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录