2026年3月,腾讯云宣布调整智能体开发平台计费策略,旗下混元系列部分模型涨幅超400%,GLM 5、MiniMax 2.5等第三方合作模型同步结束免费公测转入商用。此前亚马逊AWS、谷歌云、优刻得等国内外云厂商已先后上调AI相关服务价格,打破云计算行业20年只降不涨的惯例,引发业界对大模型普惠性下滑的普遍担忧。
家住杭州的独立AI开发者林浩3月15日凌晨收到了腾讯云的调价通知邮件,算了一笔账后他愣了:自己正在开发的智能笔记工具,原本每月调用混元大模型的成本只要1200元,调价后直接涨到了6000元,几乎要吃掉他整个项目的月度预算。而他并不是唯一受影响的从业者,本轮覆盖全球的云服务商涨价潮,正在搅动整个AI行业的成本结构。
腾讯云的调价并不是孤立事件,事实上从2026年初开始,全球云服务商就已经陆续释放了涨价信号。亚马逊AWS率先在1月底宣布上调旗下GPU算力实例和大模型推理服务价格,涨幅在10%-30%不等;谷歌云随即跟进,TPU托管服务涨幅达25%;国内云服务商优刻得也在2月底宣布大模型专属算力集群的服务费上调15%。
而腾讯云本次调价是本轮涨价潮中幅度最高的,除了混元系列部分模型涨幅超400%之外,平台上接入的GLM 5、MiniMax 2.5等热门第三方模型也全部结束免费公测,商用定价较此前的测试期价格上涨了80%-120%,直接打破了云计算行业维持了20年的“只降不涨”惯例。
此前云厂商之所以能长期维持降价节奏,核心逻辑是靠规模效应摊薄硬件成本,但这一逻辑在2026年已经失效。
2026年开年以来,大模型的落地场景已经从C端的聊天互动转向B端的生产场景,智能客服、工业缺陷检测、自动化代码生成、多模态内容生产等企业级需求爆发,据第三方机构统计,今年前两个月全球大模型Token消耗量同比2025年增长了720%,远超云厂商的算力储备预期。
此前云厂商为了抢占市场份额,不仅推出大量免费公测额度,商用定价也远低于实际成本,用旧款A100、A800芯片承载推理需求的话,单Token的能耗和折旧成本已经超过了之前的定价,涨价本质是云厂商的现金流自救动作,也是行业从跑马圈地转向盈利导向的标志。
本次涨价首先受冲击的就是中小团队和独立开发者,之前几十元就能完成的小模型微调、上千次的推理调用,现在成本直接翻了数倍,不少个人开发者的创业项目已经因为算力成本陡增被迫暂停。
与之形成对比的是,互联网大厂、金融机构等有足够资金实力的玩家,依然可以通过包年采购专属算力集群、自研硬件等方式控制AI应用成本,业界担心这种算力资源的分配差异会进一步拉大不同主体的AI能力差距,形成所谓的“AI阶层”。
不过也有行业分析师指出,随着英伟达H200等新一代推理芯片的批量交付,算力供给紧张的情况有望在2026年下半年得到缓解,短期的价格上涨只是阶段性供需错配的结果,长期来看大模型的调用成本依然会随着技术迭代逐步下降。

8 小时前
谷歌近期正在推进端侧轻量化大模型Gemini Nano 4的终端适配工作,预计2025年第一季度发布的下一代安卓旗舰机型将率先搭载该模型。其端侧推理性能较上一代提升62%,支持离线语音交互、实时图像生成等12项新增本地AI功能,无需上传数据至云端即可完成运算,在隐私安全性、响应速度上均有显著提升。

9 小时前
2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。

10 小时前
2026年4月3日,Cursor团队正式推出代码编辑器Cursor 3版本,核心搭载智能体统一工作区,支持多智能体协同、本地与云端多代码仓库无缝切换,开发者可通过多终端启动智能体,将软件开发模式从传统人机协作升级为智能体自主工作阶段,可大幅降低跨环境开发的沟通与操作成本。

11 小时前
2026年4月3日,谷歌正式发布Gemini API全新定价策略,新增标准、弹性、优先、批量、缓存五大服务档位,其中弹性、批量档位推理成本较标准档直降50%,分别适配延迟容忍度1-15分钟、最长24小时的非实时场景,可满足不同开发者从实时调用到大规模离线处理的多元算力需求。

11 小时前
2026年4月3日,谷歌DeepMind正式发布新一代开源大模型系列Gemma4,本次迭代距上一代产品发布间隔一年,不仅将开源协议更换为支持免费商用的Apache2.0,还推出4款覆盖端侧到数据中心的不同规格产品,其中310亿参数旗舰版性能位列Arena AI开源排行榜第三,单张H100显卡即可运行。

12 小时前
近期微软调整旗下AI业务核心战略,从此前依赖OpenAI GPT系列技术支撑Copilot等智能产品,转向投入超110亿美元搭建自研大模型团队,目标在2025年底前推出完全自主可控的通用AI底座,替代现有外采技术方案,相关调整已覆盖云计算、办公AI、消费级智能助手三大核心业务线。

13 小时前
2026年3月底小米正式面向全球开发者推出自研MiMo大模型首个Token Plan订阅套餐,共设四档月费39元至659元,通过统一Credit点数实现多模型多模态调用透明计费。旗下MiMo-V2-Pro模型以万亿参数、百万上下文窗口位列全球大模型评测第五,目前MiMo系列周调用量已突破4万亿Token,此举标志小米AI商业化进入规模化交付阶段。

13 小时前
2026年4月3日滴滴公开最新运营数据,其旗下AI出行助手“小滴”近一周活跃用户较年初增长37倍,00后用户占比超40%。2026年清明假期全国交通枢纽打车需求预计同比上涨239%、异地用车需求增近40%,滴滴依托大模型技术升级调度体系,推动出行服务从“打到车”向“打对车”升维。