登录体验完整功能(收藏、点赞、评论等) — 已累计有 10982 人加入

JetBrains开源12B参数Mellum2 MoE模型 适配多模型AI管线专用任务

详情页推荐

知名开发工具厂商JetBrains近日正式开源旗下大语言模型Mellum2,该模型采用120亿参数规模的混合专家(MoE)架构,单轮推理仅激活25亿参数,推理效率较同规模全参数模型提升超3倍,可高效适配多模型AI管线中的路由、检索增强生成(RAG)、子Agent调度等专用场景,为企业级AI工作流轻量化落地提供了新的高性价比选型。

当前AI落地已经从单模型调用阶段进入多模型协同的管线化时代,无论是RAG系统、多Agent架构还是企业级AI工作流,都存在大量路由、筛选、调度类中轻度任务。这类任务对响应延迟要求高,但不需要通用大模型的全能力覆盖,此前企业往往只能在“小模型效果不足”和“大模型算力浪费”之间做取舍,行业始终缺少兼顾效果、成本和速度的中间选型。

作为全球头部的开发工具厂商,JetBrains此前已经在IntelliJ IDEA、PyCharm等主流IDE产品中集成了AI编码助手,拥有大量代码及开发场景的语料积累,此次入局大模型开源领域,也被视为其向AI上游技术层延伸的标志性动作。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。