2026年WWDC全球开发者大会期间,苹果与AI软件平台LM Studio联合完成技术演示:依托四台Mac Studio搭建的集群,成功运行月之暗面(Moonshot AI)旗下总参数量达1万亿的MoE架构旗舰大模型Kimi K2.6。该成果验证了Apple Silicon架构运行超大规模AI模型的潜力,相比传统数据中心方案算力成本大幅降低。
作为月之暗面2026年推出的旗舰级通用大模型,Kimi K2.6采用当下主流的MoE混合专家架构,总参数量突破1万亿门槛。凭借动态专家调度机制,该模型实际推理过程中仅需激活约320亿参数,大幅降低了实时计算压力,但完整加载模型的FP16精度权重仍需要至少2TB的显存支撑,这一需求在过去一直是消费级甚至专业级桌面设备无法逾越的门槛。
以往要加载这类万亿参数级大模型,传统数据中心通常需要搭配8至16张高端计算GPU组成集群,整套硬件采购成本通常超过百万元,且需要配套专门的散热、供电设施,落地门槛极高。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录