MiniMax发布M2.5-HighSpeed 推理速度较同类提升3倍
继M2.5多模态大模型发布48小时内收获行业广泛关注后,MiniMax日前推出专为Agent场景优化的M2.5-HighSpeed高速版模型。该模型支持最高100TPS的极速推理能力,速度达同类产品3倍,同时配套推出分层Coding服务套餐,目前M2.5系列已接入50+国内外知名产品与平台,为AI Agent规模化落地提供了新的效率支撑。
在AI Agent成为产业落地核心赛道的当下,大模型的推理效率直接决定了应用的用户体验与商业可行性。相较于通用大模型,Agent需要处理多轮实时交互、多任务并行调度等复杂需求,对响应速度、并发承载能力提出了更高要求——比如电商大促时的智能客服、企业内部的多用户协同助手,一旦推理速度不足,就会出现“排队等待”“响应延迟”等问题,直接影响用户信任度与企业运营效率。
此前MiniMax发布的M2.5多模态大模型,凭借均衡的性能与场景适配性,上线短短48小时便吸引了大量开发者与企业关注,截至目前已成功接入超过50家国内外知名产品和平台,覆盖智能客服、内容生成、企业助手等多个领域。而此次推出的M2.5-HighSpeed,正是瞄准Agent场景的核心痛点而来。该模型实现了最高100TPS的推理性能,较同类产品速度提升3倍——这意味着在相同算力投入下,M2.5-HighSpeed能够同时处理3倍于竞品的用户请求,大幅降低单请求的推理成本。对于需要支撑百万级用户同时交互的Agent应用而言,这种级别的速度提升,直接让规模化落地从“理论可行”变成“实际可操作”。值得注意的是,M2.5-HighSpeed由华为云提供算力支撑,依托华为云的高性能AI基础设施与分布式计算框架,确保了极速推理的稳定性与可靠性,避免了高并发场景下的性能波动。
除了性能升级,MiniMax还同步推出了全新的Coding Plan服务体系,包含Plus、Max、Ultra三个分层套餐。从行业常规服务模式推测,Plus套餐大概率面向中小开发者与初创团队,以高性价比满足基础开发与测试需求;Max套餐针对中型企业,提供更丰富的功能接口与技术支持,适配日常业务的稳定运行;Ultra套餐则为大型企业或超大规模应用定制,涵盖专属算力资源、深度模型优化、7×24小时专属服务等。这种分层服务模式,能够精准匹配不同用户的成本预算与业务规模,进一步降低AI Agent应用的开发门槛。
资深AI产业分析师张磊指出,当前大模型市场的竞争已从“参数竞赛”转向“落地竞赛”,场景化优化与性能效率成为核心竞争力。MiniMax在M2.5基础上快速迭代推出高速版,精准切中Agent场景的效率痛点,不仅能帮助现有合作客户提升应用体验,也将吸引更多对延迟敏感的企业用户入局。
随着AI Agent应用的加速普及,大模型的推理速度、成本控制能力将成为衡量厂商竞争力的关键指标。MiniMax凭借M2.5系列的快速迭代与场景化布局,在多模态大模型落地赛道抢占了先机,未来其或许还会在更多细分场景推出针对性优化方案,推动AI技术从实验室走向更广泛的产业端应用。

6 小时前
2026年4月1日,腾讯QQ官方正式宣布原生接入AI智能体与自动化框架OpenClaw的v2026.3.31版本,针对网友提出的愚人节玩笑质疑,官方明确回应内容保真。用户更新对应版本后即可在QQ内实现AI养龙虾互动功能,本次更新为OpenClaw首次将QQ机器人作为内置渠道插件原生捆绑,标志着AI智能体C端落地取得重要进展。

7 天前
2026年3月25日,大模型厂商MiniMax(稀宇科技)正式开源生产级办公文档引擎Office Skills。该项目基于MIT协议开源,支持Word、Excel、PPT、PDF四大主流办公格式,通过底层技术重构绕过传统Python处理库的性能限制,可让AI生成的办公文档达到直接交付标准,破解行业长期存在的AI生成内容不可用顽疾。

9 天前
2026年3月23日,国产AI大模型厂商MiniMax宣布将原有编程订阅计划Coding Plan升级为全球首个全模态模型订阅服务Token Plan,整合旗下Hailuo视频、语音、音乐、图像生成及最新M2.7编程模型矩阵,Plus及以上套餐用户可获额外多模态调用额度,赠送额度内无需额外付费,为大模型商业化落地提供了新路径。

9 天前
2026年3月23日,国产AI厂商MiniMax正式宣布旗下AI智能体产品MaxClaw完成个人微信端接入,至此该产品已覆盖个人微信、企业微信、飞书、钉钉、Telegram、WhatsApp等6大类主流通讯及办公场景,大幅降低普通用户及中小团队AI工具使用门槛,标志着AI智能体落地正式进入全渠道普及阶段。

9 天前
2026年3月第三方AI行业监测数据显示,国产大模型厂商MiniMax旗下M2.5大模型已连续五周位居全球大模型调用量榜首,打破海外厂商长期垄断格局。该模型依托底层推理架构创新与国内能源基建优势,同等智能水平下调用成本较海外主流模型低十余倍,标志着国产大模型正实现从追随者到定义者的身份跃迁。

9 天前
2026年3月23日,国内AI厂商MiniMax(稀宇科技)宣布将原有面向开发者的Coding Plan全面升级为Token Plan,推出全球首个支持全模态模型的订阅服务。用户可通过统一密钥调用M2.7编程模型、Hailuo视频模型等全系能力,覆盖全场景办公与创作需求,Plus及以上套餐用户的多模态额度不占用原有编程资源。

14 天前
2026年3月18日,国内AI企业MiniMax正式发布新一代大模型MiniMax M2.7,这是国内首个深度参与自我迭代的大模型产品,可自主构建智能体测试框架,依托智能体协作等底层能力独立完成复杂生产力任务,标志着大模型开发从依赖人类训练转向自进化新阶段,将大幅提升复杂场景下的推理和工具调用精度。

15 天前
2026年3月,国内AGI厂商MiniMax与腾讯云宣布达成深度技术合作,双方联合研发的Agent强化学习(RL)沙箱已完成测试阶段全量平稳运行。该沙箱具备百万级吞吐、十万级并发能力,标志着AI智能体落地的底层基建能力实现重要突破,为后续大规模智能体训练、全场景商业化落地提供了核心支撑。