2026年7月2日,谷歌针对部分开发者账户大幅上调Gemini API免费配额,其中Gemini 2.5 Flash、Gemini 2.5 Flash-Lite两款轻量化模型单分钟Token处理上限提升至100万,免费层级仍保持免绑卡、不限总量的低门槛。此次调整大幅降低开发者调用成本,也凸显生成式AI赛道算力与生态竞争进入白热化阶段。

不少在谷歌AI Studio注册的个人开发者近日发现,自己调用Gemini轻量化模型时的流量限制提示几乎消失,原本需要付费升级才能获得的高吞吐量权限,现在在免费层级就能直接使用——这正是谷歌近期低调上线的API配额调整政策带来的实际变化。
在生成式AI应用开发链条中,模型API的调用成本、响应速度始终是中小团队和个人开发者的核心掣肘。此前行业内主流大模型的免费API额度普遍仅能支撑小流量Demo测试,一旦要做产品灰度、用户规模破万,开发者就要承担动辄数千元每月的调用支出,不少创意类AI项目就倒在了小规模验证到正式上线的成本关口。
头部大模型厂商的API定价策略,也直接决定了开发者生态的繁荣度。近两年OpenAI、Anthropic等厂商都曾多次下调API定价、上调免费额度,但调整幅度始终有限,高并发场景的调用成本仍处于高位。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录