108天三次迭代,M2.5完成能力跃迁 MiniMax在短短108天内完成了M2系列的三次升级,此次推出的M2.5模型进一步拉进了大模型与普惠应用的距离。模型开源权重同步上线魔搭ModelScope平台,让开发者和企业能够快速获取并使用核心能力,为低成本Agent的落地奠定了基础,标志着大模型应用的成本门槛进一步降低。 多场景评测领跑,核心指标突破行业天花板 在权威评测中,M2.5展现出强劲性能:SWE-Bench Verified测试达到80.2%,成绩超越GPT-5.2且逼近Claude Opus4.5;Multi-SWE-Bench以51.3%的得分位居多语言编程能力行业第一;搜索场景的BrowseComp指标达76.3%,工具调用与信息检索能力大幅领先。此外,该模型在编程领域具备架构师级规划能力,覆盖全开发生命周期,框架泛化能力优于Claude Opus4.6。 全流程服务加持,降低Agent落地门槛 为了覆盖不同层级用户的需求,M2.5提供了从无代码快速调用到私有化部署的全流程解决方案,同时配套工具调用、推理参数调优的实战指南。这一举措打破了Agent落地的技术和成本壁垒,让...