2026年4月发布的行业监测数据显示,全球AI大模型Token调用量在连续十周增长后出现连续两周下滑,为两年来首次逆转。4月13日至19日全球总调用量为20.6万亿Token,其中国内大模型调用量环比降23.77%至4.44万亿,美国市场环比增20.62%至4.91万亿实现反超,业内称该变化与国内阿里云、腾讯、百度等厂商3月起上调算力价格直接相关。
最近两周,不少国内AI应用开发者的后台成本预警弹出得比往常更频繁。从3月底开始,多个主流大模型API的调用单价陆续上涨,不少中小团队已经开始砍除非核心场景的大模型调用需求,这一变化最终传导到了全行业的核心运行数据上。
作为衡量AI产业真实活跃度的核心指标,大模型Token是模型处理文本的基本单位,其调用量的波动直接反映下游市场的需求变化。此前该指标已经连续十周保持正增长,却在4月首次出现连续两周下滑,4月13日至19日期间全球总调用量稳定在20.6万亿Token。
中美市场的走势分化尤为明显:此前连续两个月保持增速领先的中国大模型市场,周调用量环比大幅缩减23.77%,降至4.44万亿Token;同期美国大模型市场则实现20.62%的环比增长,周调用量达到4.91万亿Token,近两个月来首次在活跃度上反超中国市场。
业内普遍认为,国内市场调用量的快速下滑,与3月以来掀起的全行业算力涨价潮直接相关。自3月起,阿里云、腾讯云、百度智能云等国内主流云服务商先后上调了大模型训练、推理相关的算力服务价格,涨幅普遍在15%到30%之间,成本压力沿着产业链传导到大模型厂商,最终体现在API调用价格的上涨上。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
15 小时前
2026年4月,人工智能研发公司OpenAI正式推出新一代大语言模型GPT-5.5,该模型在多模态理解、复杂任务推理、长上下文处理等多维度能力均实现大幅提升。此次迭代也被视作OpenAI推进“一站式AI超级应用”长期战略的重要节点,将对全球消费级AI工具的市场竞争格局产生深远影响。

17 小时前
微软近日为旗下AI助手Copilot推出重磅功能更新,用户无需跳转第三方界面,即可在Word、Excel、PowerPoint三款核心Office应用内直接调用Copilot完成文档编辑、数据处理、演示文稿生成等操作。据官方测试数据显示,该功能可将用户Office场景办公效率平均提升62%,目前已向全球365商业版及家庭高级版用户逐步推送。

17 小时前
AI硬件软件平台开发商Era于近日宣布完成1100万美元融资,本轮资金将主要用于面向多形态AI硬件的底层软件平台研发,覆盖智能眼镜、智能戒指、智能吊坠等消费级AI可穿戴品类。该公司认为未来AI硬件将脱离手机附属品定位,形成多形态并行的独立生态,其研发的通用软件平台将解决不同硬件形态的AI能力适配难题。

20 小时前
2026年以来,全球天文领域正大规模落地AI星系探测技术,科研团队依托GPU算力支撑,可快速从PB级星际观测数据中筛选出微弱的未知天体信号。这类新增科研算力需求,已成为继大语言模型训练、AIGC内容生产之后,全球GPU供应缺口扩大的新诱因,当前高端通用GPU交付周期已延长至14个月,高端H100芯片市场溢价率超40%。

20 小时前
4月21日MIT Technology Review资深记者Mat Honan发布专题报道指出,2026年全球AI应用渗透率已突破72%,覆盖办公、消费、公共服务等全场景,但伴随隐私争议、岗位替代焦虑、信息过载等问题持续发酵,公众对AI的正面认可度较2023年峰值下跌28个百分点,全球AI产业首次进入业界所称的“AI倦怠期”。

20 小时前
2026年4月,AI大模型厂商Anthropic正式发布Claude Cowork桌面端第三方API配置指南,支持企业IT管理员在Amazon Bedrock、Google Cloud Vertex AI、Azure AI Foundry三大主流云平台快速完成企业级部署,产品已兼容macOS 13....

20 小时前
2026年4月23日,腾讯混元正式发布并开源基础设施重建后的首个大模型产品Hy3 preview。该模型为融合快慢思考逻辑的混合专家模型,总参数达295B,激活参数21B,最大支持256K上下文长度,在复杂推理、指令遵循、智能体等多维度能力上实现显著提升,主打全场景实用性。

20 小时前
2026年4月23日,腾讯正式发布混元系列最新开源大语言模型Hy3 Preview,该模型总参数达295亿,在复杂推理、指令遵循、代码处理等维度表现实现显著提升,研发阶段坚持实用性、真实评测、高性价比三大原则,目前已接入多款腾讯自有产品,同时兼容主流开源智能体工具,为开发者提供了新的高性价比选型。