知名开发工具厂商JetBrains近日正式开源旗下大语言模型Mellum2,该模型采用120亿参数规模的混合专家(MoE)架构,单轮推理仅激活25亿参数,推理效率较同规模全参数模型提升超3倍,可高效适配多模型AI管线中的路由、检索增强生成(RAG)、子Agent调度等专用场景,为企业级AI工作流轻量化落地提供了新的高性价比选型。
当前AI落地已经从单模型调用阶段进入多模型协同的管线化时代,无论是RAG系统、多Agent架构还是企业级AI工作流,都存在大量路由、筛选、调度类中轻度任务。这类任务对响应延迟要求高,但不需要通用大模型的全能力覆盖,此前企业往往只能在“小模型效果不足”和“大模型算力浪费”之间做取舍,行业始终缺少兼顾效果、成本和速度的中间选型。
作为全球头部的开发工具厂商,JetBrains此前已经在IntelliJ IDEA、PyCharm等主流IDE产品中集成了AI编码助手,拥有大量代码及开发场景的语料积累,此次入局大模型开源领域,也被视为其向AI上游技术层延伸的标志性动作。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录