2026年6月,亚马逊宣布对旗下云平台搭载的Anthropic大模型服务计费规则进行调整,原有按计算小时收费的模式将全面停用,2027年起正式切换为按Token数量计费。该调整是AI云服务成本核算精细化的标志性动作,将更精准匹配不同任务的算力消耗,也将对高频调用、长文本处理类企业用户的成本结构产生直接影响。

生成式AI商业化落地进入第三年,成本控制已经取代技术可行性,成为产业链各方最关注的核心命题。来自行业调研机构的数据显示,2026年Q1全球企业级大模型的平均调用成本同比虽然下降了27%,但单月算力投入超百万的企业数量仍较去年同期增长了180%,算力成本的优化空间始终是全行业的共同诉求。
本次亚马逊调整的Anthropic模型计费规则,核心变化是把沿用了两年的按计算小时收费模式,替换为按Token实际消耗量计费。
原有按计算小时计费的模式下,用户只要占用了模型实例的运行时长,无论调用任务是短文本问答还是长文档总结,收费标准完全统一,无法反映不同任务的实际算力消耗。而Token作为大模型处理文本的最小单元,每一次输入、输出的Token数量直接对应模型的计算负载,按Token计费相当于把收费颗粒度从“包时”细化到“按实际使用量结算”,更符合大模型的运行规律。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录