2026年4月27日,国产大模型厂商DeepSeek宣布下调全系API输入缓存命中价格至首发价的1/10,其中旗舰模型V4-Pro缓存输入价格降至0.1元/百万Tokens,叠加限时优惠后实付仅0.025元,价格仅为海外竞品GPT-5.5Pro的1/700。本次调价旨在吸引更多开发者与企业客户接入,标志着国产AI大模型的成本控制进入全新阶段。
对于很多落地大模型应用的企业来说,缓存推理成本一直是隐形的开销大头。在RAG知识库、智能客服、长文档分析这类高频调用场景中,大量重复的上下文输入会产生持续的缓存成本,不少中小企业的AI应用运营成本因此居高不下。
本次调价覆盖DeepSeek V4-Pro、V4-Flash全系列模型产品,除了将缓存命中场景价格砍至首发价的1/10,未命中场景与输出价格也同步下调至原价的1/4。按照当前的优惠计算,V4-Pro的缓存输入实际价格仅0.025元/百万Tokens,不到海外头部竞品GPT-5.5Pro价格的七百分之一。这种定价策略精准瞄准高频缓存调用场景,最高可为企业降低90%以上的AI应用运营成本,大幅降低了中小团队的落地门槛。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
55 秒前
近日开源领域传出AI生态落地新动态,Linux基金会正联合多家头部AI开发团队推进原生AI功能的社区整合,计划将大语言模型辅助开发、本地AI工具链等能力融入主流Linux发行版。不同于桌面端系统强制预装的AI功能,本次落地的所有AI工具均默认可选安装,整体基础资源占用控制在500MB以内,不会强制占用用户硬件算力。

30 分钟前
2026年4月,Red Hat旗下开源AI代理框架OpenClaw的核心维护者推出了专用容器化运行环境Tank OS。该方案针对企业批量部署OpenClaw AI代理的场景优化,可有效提升多实例集群的运行可靠性,同时大幅降低权限逃逸等安全风险,目前已经获得多家全球企业AI基础设施团队的测试邀约,为大规模开源AI落地企业场景提供了全新的安全解决方案。

1 小时前
AI语音会议转录服务商Otter于2026年4月推出面向企业用户的两大功能更新:其一为跨企业协作工具的全域内容搜索功能,允许用户在Otter生态内检索存储在第三方办公工具中的会议内容;其二发布全新Windows原生应用,支持无需加入会议即可完成会议内容抓取记录。本次更新瞄准企业协作场景的信息孤岛痛点,进一步强化了其在AI办公赛道的企业级服务能力。

2 小时前
开发平台GitHub近日宣布将旗下热门AI编程工具GitHub Copilot切换为按使用量计费模式,替代此前执行多年的统一费率订阅制。该调整源于AI智能体工作流普及带来的算力需求大幅上涨,业内认为这一变动标志着企业AI工具将迎来全新成本模型,要求企业CIO重新规划AI预算与治理框架,将影响全球超千万开发者及大量科技企业的AI采购策略。

2 小时前
中国科技公司小米近日面向开发者社区开放了MiMo-V2.5系列大模型,该模型采用MIT宽松开源许可协议发布,主打长周期运行AI智能体开发场景,配备100万token的上下文窗口,采用稀疏混合专家(MoE)架构设计,主要服务开发自主编码、工作流智能体的开发者群体,填补了开源领域长运行智能体基座模型的细分空白,引发全球AI开发社区广泛讨论。

3 小时前
OpenAI近期推出面向企业编码智能体的全新Symphony技术规范,旨在将AI的角色从辅助代码生成的单点工具,升级为软件交付全流程中的可编排核心组件。行业调研数据显示,当前超过62%的全球科技企业已经将生成式AI引入开发环节,但仅18%的企业实现了AI在开发全流程的落地,Symphony被业内认为有望填补这一落地断层。

3 小时前
2026年4月,谷歌正式在印度安得拉邦维沙卡帕特南启动千兆瓦级AI数据中心项目建设,计划未来五年总投资超150亿美元,联合印度本土企业Nxtra by Airtel、AdaniConneX打造印度首个该规模的AI算力基础设施。项目将服务印度“发达印度”发展计划,同时配套扩展光纤网络,优先接入清洁能源,助力印度实现2030年500吉瓦非化石能源目标。

3 小时前
2026年4月,业内传出国产AI厂商月之暗面的新产品动向,该公司计划于今年第三季度推出新一代大语言模型Kimi K3,其参数规模有望达到2.5万亿,超过DeepSeek V4 Pro的1.6万亿与百度文心5.0的约1万亿参数,上下文窗口也将提升至100万字级别,再次拉高了国产大模型算力竞赛的竞争门槛。