MiniMax发布M2.5-HighSpeed 推理速度较同类提升3倍 继M2.5多模态大模型发布48小时内收获行业广泛关注后,MiniMax日前推出专为Agent场景优化的M2.5-HighSpeed高速版模型。该模型支持最高100TPS的极速推理能力,速度达同类产品3倍,同时配套推出分层Coding服务套餐,目前M2.5系列已接入50+国内外知名产品与平台,为AI Agent规模化落地提供了新的效率支撑。 在AI Agent成为产业落地核心赛道的当下,大模型的推理效率直接决定了应用的用户体验与商业可行性。相较于通用大模型,Agent需要处理多轮实时交互、多任务并行调度等复杂需求,对响应速度、并发承载能力提出了更高要求——比如电商大促时的智能客服、企业内部的多用户协同助手,一旦推理速度不足,就会出现“排队等待”“响应延迟”等问题,直接影响用户信任度与企业运营效率。 此前MiniMax发布的M2.5多模态大模型,凭借均衡的性能与场景适配性,上线短短48小时便吸引了大量开发者与企业关注,截至目前已成功接入超过50家国内外知名产品和平台,覆盖智能客服、内容生成、企业助手等多个领域。而此次推...