2026年6月2日,国内大模型厂商MiniMax正式发布新一代M3大模型,京东云JoyBuilder模型开发平台同步完成首发接入并面向公众开放服务。本次接入依托京东云自研推理框架,融合PD分离部署、KV Cache缓存、投机采样等多项优化技术,实现推理吞吐量与响应效率双提升,将大幅优化开发者调用体验。

作为国内大模型赛道的重磅新品,MiniMax M3此前就因集齐顶尖编程能力、100万token超长上下文窗口、原生多模态交互三大核心能力受到行业广泛关注,是目前国内首个同时满足三项技术指标的大模型产品,部分性能表现已经跻身全球第一梯队。
大模型商业化落地的核心瓶颈之一,就是推理阶段的性能损耗——高并发场景下的延迟升高、吞吐量不足,往往会直接影响开发者的调用体验和落地场景的稳定性。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录