2026年生成式AI产业高速扩张下核心算力供需矛盾持续凸显,谷歌旗下Gemini AI平台自2025年春季以来API调用请求量翻倍,于2026年5月17日正式推出分级算力额度限制规则。作为核心客户的Meta未获得足额算力配额,内部多个AI项目研发进度被迫延后,算力已成为现阶段科技巨头AI布局的核心竞争壁垒。

不少接入Gemini API的中小开发者本月都收到了谷歌官方的配额调整通知:超出基础调用额度的请求将被触发频率限制,原本随用随付的增值调用通道也暂时关闭了新用户申请入口,这场从2026年Q2开始显现的算力短缺危机,终于从巨头内部的资源争夺蔓延到了公开生态层面。
过去一年多时间里,生成式AI的商业化落地速度远超行业预期,To C端的多模态AI助手、AI内容生产工具,To B端的企业定制大模型、智能客服系统,几乎所有AI相关产品都高度依赖上游大模型的API调用支持。其中谷歌Gemini凭借业内领先的多模态处理能力,成为开发者和企业客户的主流选择,自2025年春季以来,Gemini的API调用请求量直接翻倍,就算谷歌拥有全球规模领先的自研TPU算力集群,也难以支撑爆发式的需求增长。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录