登录体验完整功能(收藏、点赞、评论等) — 已累计有 8623 人加入

让AI触手可及,让应用激发潜能

谷歌联手Marvell研发下一代AI推理专用TPU 打破博通长期独家合作格局

4月20日,AI芯片领域曝出重磅变动:据外媒The Information援引两名直接知情人士消息,谷歌正与无晶圆厂半导体设计公司Marvell展开合作,计划开发两款全新AI芯片,包括专为AI推理场景打造的下一代TPU,以及可与TPU协同工作的内存处理单元,该项目最快将于2027年完成内存处理单元的设计,长期以来博通都是谷歌TPU的独家设计合作伙伴。

近年来,随着生成式AI落地进入快车道,大模型推理需求的增速已经远超训练需求。根据行业调研数据,当前推理业务已经占到AI云服务商总算力成本的60%以上,且这一占比仍在持续提升。谷歌作为全球头部大模型开发者和云服务提供商,旗下Gemini大模型、谷歌云AI推理服务的算力缺口持续扩大,原有单一供应商的合作模式已经难以匹配快速增长的定制化芯片需求。

此次谷歌与Marvell的合作,明确指向下一代AI基础设施芯片的开发,一共规划了两款产品:核心是专为AI推理场景打造的新一代TPU,另一款则是配套的内存处理单元,专门用于和TPU协同工作,解决大模型推理的内存带宽瓶颈。

大模型参数规模普遍达到千亿甚至万亿级别,推理过程中需要频繁读写参数,内存瓶颈一直是推高推理延迟、拉高运营成本的核心痛点。定制化协同设计的内存处理单元,有望从架构层面破解这一难题,大幅提升推理单位成本的吞吐量。按照目前披露的进度,该项目最快将于2027年完成内存处理单元的设计工作。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创