2026年4月3日,谷歌正式发布Gemini API全新定价策略,新增标准、弹性、优先、批量、缓存五大服务档位,其中弹性、批量档位推理成本较标准档直降50%,分别适配延迟容忍度1-15分钟、最长24小时的非实时场景,可满足不同开发者从实时调用到大规模离线处理的多元算力需求。
对于大量AI开发者而言,此前大模型API普遍采用的单一计费模式,一直是难以回避的成本浪费痛点:做实时交互的应用需要为低延迟付费无可厚非,但处理离线批量数据的场景,往往也要承担和实时调用相同的费率,大量预算被浪费在不需要的性能上。
谷歌本次推出的五大档位,本质是对算力资源的精细化拆分,把不同优先级的算力匹配给不同需求的用户,实现供需两端的效率最优,既降低用户的使用成本,也能提升谷歌自身的算力利用率。
本次更新的五大档位针对不同场景做了差异化设计,开发者可根据自身业务的时效要求灵活选择:
弹性档位和批量档位均给出了标准费率五折的优惠,两者的核心差异在于延迟容忍度:弹性档位利用非高峰时段的闲置算力调度,延迟在1到15分钟区间波动,适合批量内容生成、非实时用户行为分析等对时效要求不高的场景;批量档位的最长延迟可达24小时,适配大规模数据标注、多模态数据集预处理等超大规模离线任务,用户可在无时效压力的前提下将推理成本直接砍半。
除了两个折扣档位外,标准档位可满足常规的实时调用需求,适合智能客服、实时搜索增强等主流应用场景;优先档位针对对稳定性和延迟要求极高的企业级客户,提供算力预留保障,可适配金融实时风控、自动驾驶仿真等高优先级任务;缓存档位则创新地按缓存词元数量和存储时长计费,针对频繁调用相同系统提示词的对话机器人、长视频反复分析等场景,可避免重复计算固定prompt的冗余成本。
本次Gemini API的定价调整,并非谷歌的孤例,而是全球大模型厂商竞速落地的缩影。此前OpenAI曾针对GPT系列API推出批量调用折扣,国内厂商DeepSeek也上线了prompt缓存计费功能,整个行业正在从单纯拼模型效果,转向拼服务灵活性、拼成本控制能力的阶段。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
11 分钟前
2026年4月,国产多模态AI赛道再添新玩家,京东推出全新一体化空间图像编辑大模型JoyAI-Image-Edit,据资深科技作者江宇调研报道,该模型基准评测性能追平谷歌Gemini 2.5 Pro,在空间编辑任务上表现超越主流视频模型。本次京东同步开放开源,结合自身供应链优势推进落地,主打电商内容生成、具身智能训练数据生产场景。

13 分钟前
当前全球企业落地生成式AI的过程中,自研、第三方AI代理数量快速扩张,普遍面临管控分散、权责不清、生命周期难以管理的“AI代理泛滥”问题。亚马逊AWS近日针对这一行业痛点推出全新的Bedrock Agent Registry集中注册表工具,旨在为企业提供统一的AI代理可见性、所有权归属管理与全生命周期管控能力,帮助企业降低AI规模化落地的治理风险。

1 小时前
4月10日,清华系AI视频领域初创企业生数科技宣布完成近20亿元人民币B轮融资,本轮融资由阿里云领投,中网投、九安海棠、好未来等机构参与战略投资,包括BV百度风投在内的多家原有股东追加投资。这是生数科技两个月内获得的第二笔大额融资,叠加此前各轮后,其公开累计融资总额已突破25亿元,投资方汇聚多家头部互联网企业与顶级投资机构。

1 小时前
4月10日,外媒The Information援引知情人士消息,首次披露埃隆·马斯克旗下太空企业SpaceX与AI子公司xAI的2025年合并财务数据。这份从未公开的财报显示,SpaceX全年营收超过185亿美元,约合人民币1267亿元,合并口径下净亏损近50亿美元,折合人民币约342亿元,亏损主要来自xAI的大模型研发投入,引发AI行业对前沿研发成本模式的关注。

2 小时前
当前多AI智能体协作是生成式AI落地企业复杂场景的核心方向之一,不少项目在测试部署中都出现了任务混乱、效率低下等问题。近日行业分析指出,超六成该类项目的协作故障并非源于AI智能体本身能力缺陷,问题核心出在连接不同智能体的协调层架构缺失,这一结论为行业梳理AI智能体落地瓶颈指明了新方向。

2 小时前
2026年4月,字节跳动旗下红果免费短剧宣布行业标志性调整:将原有分开排名的真人实拍短剧与AI仿真人短剧,合并入同一热播总榜统一排名。据DataEye研究院监测,4月5日AI生成短剧《菩提临世真人AI版》首次登顶总榜榜首,成为AI内容热度超越传统实拍内容的里程碑。目前AI短剧制作成本仅为传统真人短剧的十分之一,正深刻改变短剧行业格局。

3 小时前
网络研究机构Graphite于2026年4月发布最新调查报告,通过Surfer AI检测工具分析65000个网址后得出结论:当前全球互联网上的AI生成内容占比已经正式超越人类原创内容。该工具依托覆盖18年的互联网网页数据库,每月更新30亿至50亿个网页,自2022年ChatGPT发布以来,AI生成内容占比呈现陡增趋势,这一结果也引发了AI行业对创意枯竭与模型发展风险的讨论。

3 小时前
2026年4月10日,联想集团在2026/2027财年中国区誓师大会上,由集团执行副总裁兼中国区总裁刘军正式宣布,将在新财年推出全新硬件品类AI主机,推动AI从单纯软件应用转向硬件原生深度融合。新产品将覆盖个人与不同规模企业客户,依托天禧AI生态落地全场景AI服务,加速AI技术在各领域的规模化应用。