京东开源JoyAI-LLM-Flash大模型 48B参数配高效激活架构
2月14日,京东在Hugging Face平台开源JoyAI-LLM-Flash大模型,这款模型以48B总参数+3B激活参数的独特设计,在20万亿文本Token预训练底座支撑下,展现出强劲的前沿知识理解、推理及编程能力,其自研的FiberPO优化框架更破解了大模型规模扩展不稳定难题,为行业提供了高效部署的新范式。
在大模型技术从“参数竞赛”转向“效率竞赛”的当下,京东此次开源的JoyAI-LLM-Flash无疑踩中了行业痛点。不同于传统大模型追求全参数激活的思路,该模型采用动态激活机制:总参数规模达48B的同时,仅需激活3B参数即可运行。这一设计既保留了大参数预训练带来的知识广度和深度,又大幅降低了模型部署的算力成本,让中小企业和开发者也能快速接入高性能大模型能力,无需为全参数运行的高昂算力投入发愁。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录