登录体验完整功能(收藏、点赞、评论等) — 已累计有 11128 人加入

AI推理成本暴涨超2倍 全行业从扩张转向成本管控

详情页推荐

据2026年上半年AI行业调研数据,头部大模型厂商的单位token推理成本较2024年同比上涨217%,过去两年奉行tokenmaxxing扩张策略的行业逻辑彻底反转。微软、OpenAI、国内大模型厂商DeepSeek等均已将成本管控列为核心业务优先级,全行业正从跑马圈地的粗放增长转向精益运营的新阶段。

配图

6月初某头部大模型厂商的内部会上,此前负责模型能力迭代的团队第一次把单位token成本下降率放在了和“上下文窗口长度”“回答准确率”同等重要的考核位置——这样的变化正在几乎所有AI公司内部发生。

2023到2025年的大模型竞赛周期里,所有厂商都把“能力最大化”作为核心目标,行业甚至催生了tokenmaxxing的共识:尽可能堆高参数规模、拉长上下文窗口,让模型处理更多token,为用户提供更丰富的生成内容,成本问题完全被高速增长的用户数据和热钱涌入的资本环境掩盖。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。