京东开源JoyAI-LLM-Flash大模型 48B参数配高效激活架构 2月14日,京东在Hugging Face平台开源JoyAI-LLM-Flash大模型,这款模型以48B总参数+3B激活参数的独特设计,在20万亿文本Token预训练底座支撑下,展现出强劲的前沿知识理解、推理及编程能力,其自研的FiberPO优化框架更破解了大模型规模扩展不稳定难题,为行业提供了高效部署的新范式。 在大模型技术从“参数竞赛”转向“效率竞赛”的当下,京东此次开源的JoyAI-LLM-Flash无疑踩中了行业痛点。不同于传统大模型追求全参数激活的思路,该模型采用动态激活机制:总参数规模达48B的同时,仅需激活3B参数即可运行。这一设计既保留了大参数预训练带来的知识广度和深度,又大幅降低了模型部署的算力成本,让中小企业和开发者也能快速接入高性能大模型能力,无需为全参数运行的高昂算力投入发愁。 支撑模型核心能力的是其扎实的预训练底座:20万亿文本Token的训练数据覆盖了全球前沿学术论文、行业技术文档、主流代码库、跨领域知识库等多元内容,使得JoyAI-LLM-Flash在复杂推理任务、多语言编程、智能体交...