当前生成式AI服务普遍采用的token计费模式,正让大量企业云客户陷入成本误判,看似低廉的调用成本正在掩盖长期规模化部署后的支出风险。据行业测算,当企业生成式AI调用量提升至当前的10倍以上时,token相关支出占云服务总费用的比例将从不足5%跃升至30%以上,后续调价、用量溢出等问题更可能引发全面成本危机。
国内某连锁零售企业的IT负责人最近算了一笔账:今年二季度接入大模型生成商品详情页、客服应答内容以来,单月token调用支出仅为1.2万元,远低于此前预期的10万元AI改造预算,他甚至已经在规划明年把AI生成内容的覆盖范围扩大到全品类、全渠道触点。这并非个例,当前多数企业都对生成式AI的落地成本持有极度乐观的判断。
当前全球主流生成式AI服务商均采用token作为基础计费单位,无论是OpenAI的GPT系列、Anthropic的Claude,还是国内的文心一言、通义千问,都按照用户输入的prompt长度、AI输出内容的长度折算为token数量计费。为了抢占企业级市场,过去一年各服务商持续下调token单价,OpenAI今年已两次下调GPT-3.5的token价格,最高降幅超过70%,进一步压低了企业的成本预期。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录