2026年3月最新行业消息显示,苹果AI硬件战略遭遇现实瓶颈:旗下私有云计算服务器闲置率高达90%,实际部署算力仅占10%,根源在于内部AI基础设施碎片化、各业务团队技术栈互不兼容。为推进下一代Siri功能,苹果暂时依托谷歌服务器与定制版Gemini模型,今年将推出重大改版Siri,明年iOS 27还将上线独立Siri聊天机器人。目前苹果正推进代号“Baltra”的自研AI服务器芯片项目,联合博通、采用台积电3nm工艺与先进芯粒架构寻求算力自主。
3月初曝光的苹果内部算力运营数据揭开了其AI基建的尴尬一角:该公司目前部署的私有云计算集群总规模可观,但仅有不足10%的服务器处于活跃运行状态,剩余九成算力处于闲置状态。这一悬殊比例并非硬件不足,而是内部技术架构的顽疾所致。
苹果内部各业务部门的AI技术栈长期处于碎片化状态——从Siri的语音交互团队到图像处理AI团队,各自采用独立的算力调度框架与硬件适配方案,无法形成统一的内部算力池。这导致即便苹果斥资搭建了大规模私有云,也无法实现算力的跨部门调度与高效复用,最终出现大量服务器闲置却无法支撑核心AI项目的窘境。
作为一直强调“隐私优先”和“生态闭环”的科技巨头,苹果此番转向谷歌算力的举动着实让不少行业观察者感到意外。为了不耽误下一代Siri的迭代节奏,苹果暂时放弃依赖内部算力的计划,采用谷歌服务器作为临时支撑,同时搭载谷歌定制版Gemini多模态AI模型。
根据规划,今年苹果将推出重大改版的Siri,明年随iOS 27系统更新上线独立的Siri聊天机器人功能,彻底重构用户与智能助手的交互体验。这一举措虽解了燃眉之急,但也让苹果再次暴露了对外部AI基础设施的依赖,与其一贯的生态闭环战略形成微妙冲突。
为彻底摆脱对外部算力的依赖,苹果目前正全力推进代号为“Baltra”的自研AI服务器芯片项目。这也是苹果首次针对云端AI场景推出自研服务器芯片,此前其自研芯片主要集中在移动端的M系列、Watch的S系列等消费级硬件领域。
该项目由苹果与博通联合研发,将采用台积电3nm先进制程工艺,同时搭载芯粒架构设计,能够灵活组合不同算力单元以适配多样化的AI工作负载。相较于传统的统一架构芯片,芯粒设计可以更好地匹配苹果内部碎片化的AI业务需求,有望将私有云算力利用率提升至70%以上,从根源上解决当前的闲置难题。
苹果的算力闲置困境并非个例,不少科技巨头在AI转型初期都曾遭遇内部基建碎片化的问题。此次苹果推出Baltra项目的尝试,也为行业提供了一个参考样本:自研专用AI服务器芯片不仅能提升算力自主性,还能针对性适配内部业务需求,降低对外部厂商的依赖。
按照当前的研发节奏,Baltra芯片有望在2027年前后完成量产部署,届时苹果将能够完全重构内部AI算力体系,不再依赖谷歌服务器支撑核心AI功能,同时为后续的Vision Pro、Mac等设备的AI功能升级提供充足的算力支撑。

17 分钟前
2026年3月,Google DeepMind发布Gemini 3.1 Flash-Lite预览版,作为Gemini 2.5 Flash-Lite的迭代产品。该模型每秒输出超360个token,智能指数提升12分至34分,Elo分数达1432,多模态与科学推理表现优异,却将输出价格上调近三倍,引发AI行业关注。

1 小时前
2026年3月4日,Palo Alto Networks旗下Unit42安全研究团队披露谷歌Chrome浏览器高危漏洞CVE-2026-0628,该漏洞允许恶意扩展程序劫持内置Gemini Live AI面板,绕过Chrome原生安全防护,获取系统级权限,可跨权调用摄像头、读取本地敏感文件,甚至植入钓鱼内容,为AI功能深度集成浏览器的当下敲响安全警钟。

2 小时前
据科技媒体爱范儿2026年3月4日的公开报道,OpenAI疑似推出全新GPT-5.3大模型,与Google Gemini同期发布引发全球AI行业关注;同时,长期被贴上“廉价”标签的带“Instant”“Lite”后缀的轻量AI模型,其性能短板正被针对性填补,兼顾成本与智能的核心优势开始凸显。

2 小时前
2026年3月2日,谷歌家居负责人阿尼什·卡图卡兰在社交平台宣布,Google Home迎来基于Gemini大模型的史诗级升级,新增Live Search实时画面理解功能。Nest摄像头不再仅被动记录录像,可实时解析当前画面内容,用户可直接问询场景状态,彻底改变传统智能家居监控逻辑,目前该升级已正式向全球用户推送。

2 小时前
2026年3月4日,Google DeepMind发布Gemini 3.1 Flash-Lite预览版,作为Gemini系列最快的轻量型大模型,其保留每秒超360个token的输出速度与5.1秒平均响应时间,经Artificial Analysis监测智能得分较前代提升12分至34分,Arena.ai Elo分数达1432,官方同步宣布其输出价格较前代上调三倍。

2 小时前
3月3日,谷歌官方发布Gemini 3系列最新轻量AI模型Gemini 3.1 Flash-Lite,该模型被官方称为系列中速度最快、最具成本效益的产品,首字响应速度较前代提升2.5倍。目前开发者可通过Google AI Studio的Gemini API获取预览版,企业级用户则可在Vertex AI平台同步体验。

4 小时前
近日苹果AI战略遭遇核心算力困境:近90%私有云计算服务器处于闲置状态,实际部署仅10%,因内部AI基础设施碎片化、各团队技术栈不统一,暂时借谷歌服务器支撑下一代Siri。今年苹果将推出由定制版Gemini模型驱动的重大改版Siri,同时推进代号“Baltra”的自研AI服务器芯片项目,试图突围当前困局。

4 小时前
社交巨头Meta正秘密测试名为“AI购物研究”的新功能,将旗下Meta AI助手升级为电商导购工具,直接对标OpenAI的ChatGPT与谷歌的Gemini。目前该功能已向部分美国用户开放,能以轮播卡片形式推送含品牌、价格及官网链接的商品,还会结合用户地理位置、社交偏好生成个性化推荐,旨在抢占AI时代的消费决策入口。