登录体验完整功能(收藏、点赞、评论等) — 已累计有 12598 人加入

谷歌大幅扩容Gemini API免费额度 轻量化模型吞吐量破百万级

详情页推荐

2026年7月2日,谷歌针对部分开发者账户大幅上调Gemini API免费配额,其中Gemini 2.5 Flash、Gemini 2.5 Flash-Lite两款轻量化模型单分钟Token处理上限提升至100万,免费层级仍保持免绑卡、不限总量的低门槛。此次调整大幅降低开发者调用成本,也凸显生成式AI赛道算力与生态竞争进入白热化阶段。

配图

不少在谷歌AI Studio注册的个人开发者近日发现,自己调用Gemini轻量化模型时的流量限制提示几乎消失,原本需要付费升级才能获得的高吞吐量权限,现在在免费层级就能直接使用——这正是谷歌近期低调上线的API配额调整政策带来的实际变化。

在生成式AI应用开发链条中,模型API的调用成本、响应速度始终是中小团队和个人开发者的核心掣肘。此前行业内主流大模型的免费API额度普遍仅能支撑小流量Demo测试,一旦要做产品灰度、用户规模破万,开发者就要承担动辄数千元每月的调用支出,不少创意类AI项目就倒在了小规模验证到正式上线的成本关口。

头部大模型厂商的API定价策略,也直接决定了开发者生态的繁荣度。近两年OpenAI、Anthropic等厂商都曾多次下调API定价、上调免费额度,但调整幅度始终有限,高并发场景的调用成本仍处于高位。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。