中国大模型周调用量破4万亿Token 首次反超美国阵营

1 小时前 AI快讯 2

全球最大AI模型API聚合平台OpenRouter最新数据显示,在9日至15日的一周内,中国大模型总调用量达4.12万亿Token,首次超过美国阵营的2.94万亿Token。调用量排名前五的模型中,中国厂商占据四席——MiniMax M2.5、月之暗面KimiK2.5、智谱GLM-5及DeepSeek系列,这一数据标志着全球大模型市场格局出现关键转向,也折射出中美AI赛道的差异化演进与商业化困局。

当OpenRouter的周度报告出炉时,整个AI行业的视线都被一组数据牢牢锁定:过去两年长期由美国大模型主导的API调用市场,第一次被中国阵营以显著优势反超。4.12万亿Token的调用规模,相当于数千万用户在一周内完成了海量的文本生成、代码编写、长文档处理等交互行为,中国大模型的用户渗透速度远超行业预期。

从具体排名来看,调用量前五的模型中,中国厂商的四款产品几乎包揽了第二至第五位,仅存的美国模型为OpenAI GPT-4o。其中,月之暗面KimiK2.5凭借长文本处理能力持续吸引C端深度用户与企业客户,智谱GLM-5则在多模态交互和企业级服务落地中表现突出,MiniMax M2.5以高效推理速度抢占了轻量场景,DeepSeek系列则在代码生成与数学计算领域形成差异化竞争力。

这一结果并非偶然。过去一年,中国大模型厂商普遍采取“快速迭代+场景深耕”的策略,避开美国通用大模型的技术锋芒,转而在垂直需求上做深做透。例如Kimi的“百万字长文本总结”功能,精准击中了科研、法律、出版等领域的痛点,而智谱的多模态能力则适配了教育、电商等场景的视觉+文本交互需求。

与调用量的亮眼表现形成反差的,是中国新势力AI厂商普遍面临的盈利困境。业内人士透露,多数头部中国大模型厂商仍处于“越卖越亏”的状态:一方面,大模型推理的算力成本居高不下,每万亿Token的交互需要消耗数千元的GPU资源;另一方面,为了争夺用户,厂商普遍采取低价甚至免费的API策略,获客与运营成本持续高企。

此前行业热议的“给AI装上手和脚”——即推动大模型落地到机器人、工业控制、企业办公等实体场景——虽然打开了商业化想象空间,但定制化开发、场景适配的成本同样不菲。不少厂商在落地项目中投入的资源,远超过从客户处获得的短期收益,“账能不能算平”成为摆在所有从业者面前的核心问题。

调用量的反超,本质上反映了中美大模型赛道的“大分叉”。美国阵营仍在通用智能的极致性能上持续投入,OpenAI GPT-4o、谷歌Gemini Ultra等模型不断刷新多模态能力的天花板,试图构建覆盖全场景的生态壁垒;而中国厂商则更偏向“实用主义”,通过快速迭代细分能力抢占垂直市场,以高性价比的API服务吸引用户。

这种差异背后,既有技术底座的资源限制,也有市场需求的导向作用。中国庞大的中小企业市场,对低成本、场景化的AI服务需求迫切,而美国市场则更关注通用智能的长期价值。未来,全球AI市场的“分叉”可能会愈发明显,两条路径将各自探索商业化的可行边界。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创