MiniMax发布M2.5-HighSpeed 推理速度跃升3倍赋能AI应用
继M2.5模型发布48小时内引发行业关注后,AI初创公司MiniMax再度抛出重磅动作——2月16日正式推出M2.5-HighSpeed高速推理模型,其峰值推理速度达100TPS,是同类产品的3倍,精准瞄准Agent场景下的高并发需求。同时,品牌同步上线三款差异化Coding Plan套餐及好友邀请9折福利,进一步打通技术能力与用户需求的落地通道。
自M2.5模型亮相以来,MiniMax的市场推进速度超出行业预期。数据显示,该模型发布仅48小时便获得众多开发者与平台的青睐,目前已成功接入50+国内外知名产品和平台,覆盖智能客服、AI创作、多Agent协作等多个热门应用场景。这种快速落地的背后,是市场对MiniMax模型能力的认可,同时也反映出当前大模型行业对“高性能+高性价比”服务的迫切需求——尤其是在Agent成为AI应用核心落地场景的当下,模型的实时响应能力直接决定用户体验与商业价值。
为了响应Agent场景中日益增长的并发处理要求,MiniMax此次推出的M2.5-HighSpeed模型在推理效率上实现了突破性提升。100TPS的峰值处理能力意味着,该模型每秒可完成100次令牌级别的推理请求,这一速度是当前市场同类通用大模型的3倍。在实际应用中,这一性能升级将直接解决Agent场景下的核心痛点:比如在多轮对话式智能助手场景中,用户无需等待冗长的响应时间;在企业级多Agent协作系统中,能支持更多任务同时调度与执行,大幅降低系统延迟,提升整体运行效率。对于依赖AI驱动的客服平台、自动化办公工具而言,这一速度提升还能直接降低算力成本,让企业用更少的资源处理更多业务需求。
除了技术上的迭代,MiniMax此次还同步完善了商业化服务体系,推出全新的Coding Plan套餐,涵盖Plus、Max、Ultra三个层级。结合行业常规逻辑推测,三款套餐大概率会针对不同用户群体提供差异化服务:Plus套餐可能面向个人开发者与小型团队,提供基础调用额度与标准API服务;Max套餐适配中型企业客户,包含更高的并发权限与优先技术支持;Ultra套餐则为大型企业或高并发场景定制,可能提供专属算力集群与定制化模型优化服务,全方位满足从个人到企业的多元需求。
为进一步降低用户的使用门槛,MiniMax还推出了好友邀请福利机制:现有用户通过邀请好友注册并开通Coding Plan,双方均可享受9折优惠。这一举措不仅能快速拓展用户群体,也能通过用户间的口碑传播,提升品牌在开发者社区的渗透度,为技术能力的规模化落地积累用户基础。
从行业视角来看,当前大模型市场的竞争已从早期的“参数竞赛”转向“效率竞赛”。随着Agent成为AI应用落地的核心载体,推理速度、并发能力与成本控制成为企业选择大模型服务的关键指标。MiniMax此次推出M2.5-HighSpeed模型,正是抓住了这一市场趋势,通过性能差异化打造核心竞争力。而配套的商业化套餐与用户福利,则为技术能力的落地搭建了更顺畅的桥梁。
对于MiniMax而言,从M2.5的快速破圈到M2.5-HighSpeed的性能跃升,再到商业化体系的完善,其正在构建“技术领先+服务适配+用户增长”的完整闭环。未来,随着大模型技术的不断成熟,MiniMax或许将在多模态融合、Agent工具调用等领域持续发力,为AI应用的规模化落地提供更高效的解决方案。

3 小时前
2026年4月,AI大模型研发商Anthropic在清理平台上泄露的自家源代码过程中出现操作失误,提交的下架申请误伤数千个无关GitHub开源仓库。Anthropic高管随后公开承认事故为人为操作导致,已第一时间撤销绝大多数不当下架通知,目前GitHub已逐步恢复所有被误下架仓库的正常访问权限。

7 天前
2026年3月25日,大模型厂商MiniMax(稀宇科技)正式开源生产级办公文档引擎Office Skills。该项目基于MIT协议开源,支持Word、Excel、PPT、PDF四大主流办公格式,通过底层技术重构绕过传统Python处理库的性能限制,可让AI生成的办公文档达到直接交付标准,破解行业长期存在的AI生成内容不可用顽疾。

9 天前
2026年3月23日,国产AI大模型厂商MiniMax宣布将原有编程订阅计划Coding Plan升级为全球首个全模态模型订阅服务Token Plan,整合旗下Hailuo视频、语音、音乐、图像生成及最新M2.7编程模型矩阵,Plus及以上套餐用户可获额外多模态调用额度,赠送额度内无需额外付费,为大模型商业化落地提供了新路径。

9 天前
2026年3月23日,国产AI厂商MiniMax正式宣布旗下AI智能体产品MaxClaw完成个人微信端接入,至此该产品已覆盖个人微信、企业微信、飞书、钉钉、Telegram、WhatsApp等6大类主流通讯及办公场景,大幅降低普通用户及中小团队AI工具使用门槛,标志着AI智能体落地正式进入全渠道普及阶段。

9 天前
2026年3月第三方AI行业监测数据显示,国产大模型厂商MiniMax旗下M2.5大模型已连续五周位居全球大模型调用量榜首,打破海外厂商长期垄断格局。该模型依托底层推理架构创新与国内能源基建优势,同等智能水平下调用成本较海外主流模型低十余倍,标志着国产大模型正实现从追随者到定义者的身份跃迁。

9 天前
2026年3月23日,国内AI厂商MiniMax(稀宇科技)宣布将原有面向开发者的Coding Plan全面升级为Token Plan,推出全球首个支持全模态模型的订阅服务。用户可通过统一密钥调用M2.7编程模型、Hailuo视频模型等全系能力,覆盖全场景办公与创作需求,Plus及以上套餐用户的多模态额度不占用原有编程资源。

13 天前
2026年3月19日,昆仑万维宣布旗下天工AI大模型SkyReels V4在第三方机构Artificial Analysis的文生视频(含音频)赛道评测中斩获全球第一,性能超越Kling3.0、Google Veo3.1、OpenAI Sora2等主流产品,依托全模态强化学习与逻辑推理技术突破,可实现1080p15秒商用级长序列生成,解决了行业长期存在的视频一致性与叙事逻辑难题。

14 天前
2026年3月18日腾讯发布2025年第四季度及全年财报,全年总营收达7517.7亿元,其中金融科技及企业服务(ToB)业务全年营收2294.3亿元创历史新高,腾讯云首次实现全年规模盈利。同期腾讯AI战略全面提速,混元大模型迭代加速,多款AI智能体产品落地,有效增强核心业务抗波动韧性。