MiniMax发布M2.5-HighSpeed 推理速度跃升3倍赋能AI应用

3 小时前 AI快讯 1

继M2.5模型发布48小时内引发行业关注后，AI初创公司MiniMax再度抛出重磅动作——2月16日正式推出M2.5-HighSpeed高速推理模型，其峰值推理速度达100TPS，是同类产品的3倍，精准瞄准Agent场景下的高并发需求。同时，品牌同步上线三款差异化Coding Plan套餐及好友邀请9折福利，进一步打通技术能力与用户需求的落地通道。

自M2.5模型亮相以来，MiniMax的市场推进速度超出行业预期。数据显示，该模型发布仅48小时便获得众多开发者与平台的青睐，目前已成功接入50+国内外知名产品和平台，覆盖智能客服、AI创作、多Agent协作等多个热门应用场景。这种快速落地的背后，是市场对MiniMax模型能力的认可，同时也反映出当前大模型行业对“高性能+高性价比”服务的迫切需求——尤其是在Agent成为AI应用核心落地场景的当下，模型的实时响应能力直接决定用户体验与商业价值。

为了响应Agent场景中日益增长的并发处理要求，MiniMax此次推出的M2.5-HighSpeed模型在推理效率上实现了突破性提升。100TPS的峰值处理能力意味着，该模型每秒可完成100次令牌级别的推理请求，这一速度是当前市场同类通用大模型的3倍。在实际应用中，这一性能升级将直接解决Agent场景下的核心痛点：比如在多轮对话式智能助手场景中，用户无需等待冗长的响应时间；在企业级多Agent协作系统中，能支持更多任务同时调度与执行，大幅降低系统延迟，提升整体运行效率。对于依赖AI驱动的客服平台、自动化办公工具而言，这一速度提升还能直接降低算力成本，让企业用更少的资源处理更多业务需求。

除了技术上的迭代，MiniMax此次还同步完善了商业化服务体系，推出全新的Coding Plan套餐，涵盖Plus、Max、Ultra三个层级。结合行业常规逻辑推测，三款套餐大概率会针对不同用户群体提供差异化服务：Plus套餐可能面向个人开发者与小型团队，提供基础调用额度与标准API服务；Max套餐适配中型企业客户，包含更高的并发权限与优先技术支持；Ultra套餐则为大型企业或高并发场景定制，可能提供专属算力集群与定制化模型优化服务，全方位满足从个人到企业的多元需求。

为进一步降低用户的使用门槛，MiniMax还推出了好友邀请福利机制：现有用户通过邀请好友注册并开通Coding Plan，双方均可享受9折优惠。这一举措不仅能快速拓展用户群体，也能通过用户间的口碑传播，提升品牌在开发者社区的渗透度，为技术能力的规模化落地积累用户基础。

从行业视角来看，当前大模型市场的竞争已从早期的“参数竞赛”转向“效率竞赛”。随着Agent成为AI应用落地的核心载体，推理速度、并发能力与成本控制成为企业选择大模型服务的关键指标。MiniMax此次推出M2.5-HighSpeed模型，正是抓住了这一市场趋势，通过性能差异化打造核心竞争力。而配套的商业化套餐与用户福利，则为技术能力的落地搭建了更顺畅的桥梁。

对于MiniMax而言，从M2.5的快速破圈到M2.5-HighSpeed的性能跃升，再到商业化体系的完善，其正在构建“技术领先+服务适配+用户增长”的完整闭环。未来，随着大模型技术的不断成熟，MiniMax或许将在多模态融合、Agent工具调用等领域持续发力，为AI应用的规模化落地提供更高效的解决方案。

本文内容来源于公开互联网信息，并包含平台新增内容及用户发布内容，旨在进行知识整理与分享。文中所有信息与观点均仅供参考，不代表任何官方或特定立场，亦不构成任何操作或决策建议，请读者谨慎甄别，详情请见完整免责声明

所属分类

AI快讯

MiniMax发布M2.5-HighSpeed 推理速度跃升3倍赋能AI应用

GLM-5全球需求暴增超预期智谱启动算力合伙人计划

Claude Opus 4.6登顶AI智能指数算力效率领先GPT-5.2

阿里巴巴除夕夜开源千问Qwen3.5 架构迎来全面创新