MiniMax发布M2.5-HighSpeed 推理速度较同类提升3倍
继M2.5多模态大模型发布48小时内收获行业广泛关注后,MiniMax日前推出专为Agent场景优化的M2.5-HighSpeed高速版模型。该模型支持最高100TPS的极速推理能力,速度达同类产品3倍,同时配套推出分层Coding服务套餐,目前M2.5系列已接入50+国内外知名产品与平台,为AI Agent规模化落地提供了新的效率支撑。
在AI Agent成为产业落地核心赛道的当下,大模型的推理效率直接决定了应用的用户体验与商业可行性。相较于通用大模型,Agent需要处理多轮实时交互、多任务并行调度等复杂需求,对响应速度、并发承载能力提出了更高要求——比如电商大促时的智能客服、企业内部的多用户协同助手,一旦推理速度不足,就会出现“排队等待”“响应延迟”等问题,直接影响用户信任度与企业运营效率。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录