登录体验完整功能(收藏、点赞、评论等) — 已累计有 12310 人加入

京东开源JoyAI-LLM-Flash大模型 48B参数配高效激活架构

详情页推荐

京东开源JoyAI-LLM-Flash大模型 48B参数配高效激活架构

2月14日,京东在Hugging Face平台开源JoyAI-LLM-Flash大模型,这款模型以48B总参数+3B激活参数的独特设计,在20万亿文本Token预训练底座支撑下,展现出强劲的前沿知识理解、推理及编程能力,其自研的FiberPO优化框架更破解了大模型规模扩展不稳定难题,为行业提供了高效部署的新范式。

在大模型技术从“参数竞赛”转向“效率竞赛”的当下,京东此次开源的JoyAI-LLM-Flash无疑踩中了行业痛点。不同于传统大模型追求全参数激活的思路,该模型采用动态激活机制:总参数规模达48B的同时,仅需激活3B参数即可运行。这一设计既保留了大参数预训练带来的知识广度和深度,又大幅降低了模型部署的算力成本,让中小企业和开发者也能快速接入高性能大模型能力,无需为全参数运行的高昂算力投入发愁。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。