2026年4月27日,国产大模型厂商DeepSeek宣布下调全系API输入缓存命中价格至首发价的1/10,其中旗舰模型V4-Pro缓存输入价格降至0.1元/百万Tokens,叠加限时优惠后实付仅0.025元,价格仅为海外竞品GPT-5.5Pro的1/700。本次调价旨在吸引更多开发者与企业客户接入,标志着国产AI大模型的成本控制进入全新阶段。
对于很多落地大模型应用的企业来说,缓存推理成本一直是隐形的开销大头。在RAG知识库、智能客服、长文档分析这类高频调用场景中,大量重复的上下文输入会产生持续的缓存成本,不少中小企业的AI应用运营成本因此居高不下。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录