京东开源JoyAI-LLM-Flash大模型 48B参数配高效激活架构
2月14日,京东在Hugging Face平台开源JoyAI-LLM-Flash大模型,这款模型以48B总参数+3B激活参数的独特设计,在20万亿文本Token预训练底座支撑下,展现出强劲的前沿知识理解、推理及编程能力,其自研的FiberPO优化框架更破解了大模型规模扩展不稳定难题,为行业提供了高效部署的新范式。
在大模型技术从“参数竞赛”转向“效率竞赛”的当下,京东此次开源的JoyAI-LLM-Flash无疑踩中了行业痛点。不同于传统大模型追求全参数激活的思路,该模型采用动态激活机制:总参数规模达48B的同时,仅需激活3B参数即可运行。这一设计既保留了大参数预训练带来的知识广度和深度,又大幅降低了模型部署的算力成本,让中小企业和开发者也能快速接入高性能大模型能力,无需为全参数运行的高昂算力投入发愁。
支撑模型核心能力的是其扎实的预训练底座:20万亿文本Token的训练数据覆盖了全球前沿学术论文、行业技术文档、主流代码库、跨领域知识库等多元内容,使得JoyAI-LLM-Flash在复杂推理任务、多语言编程、智能体交互等场景中表现突出。据技术团队测试数据显示,在同等硬件条件下,该模型对2025年后发布的前沿技术术语理解准确率比同量级传统模型高出12%,Python代码生成的通过率提升近18%,能更好地满足科研机构、科技企业对专业级AI助手的需求。
而真正让JoyAI-LLM-Flash脱颖而出的,是其背后的FiberPO优化框架。京东首次将数学领域的纤维丛理论引入大模型强化学习训练,这一创新让模型不同模块的参数更新形成协同关联的“纤维结构”,避免了传统模型在规模扩张时容易出现的参数紊乱、性能波动问题——此前不少大模型在参数突破30B后,会出现推理精度不稳定、训练效率骤降的情况,FiberPO框架则从底层逻辑上解决了这一行业共性难题。搭配自研的Muon优化器与MTP(多任务并行)技术,该框架成功将模型训练的吞吐量提升了1.3x-1.7x,同时将参数扩展过程中的稳定性系数从72%提升至95%以上,为大模型向更大规模演进扫清了技术障碍。
行业专家认为,JoyAI-LLM-Flash的开源不仅是京东AI技术积累的一次对外输出,更将推动大模型高效化部署的技术迭代。此前,大模型的规模化落地始终受限于算力成本高、扩展不稳定等问题,而这款模型的“大参数底座+小激活参数”模式,结合FiberPO框架的技术突破,为企业级AI应用提供了可落地的参考方案。对于京东自身而言,该模型也将快速融入其电商、物流、云服务等业务场景,比如在智能客服的多轮推理、供应链的需求预测等环节,提升效率并降低运营成本。
随着AI技术的深入落地,企业对大模型的需求已从“能用”转向“好用、划算”。JoyAI-LLM-Flash的开源,标志着大模型行业正从追求极致性能向平衡性能与成本的方向迈进。未来,这类融合数学理论与工程实践的技术创新,将持续推动AI普惠化,让更多行业享受到大模型带来的价值。

1 个月前
京东开源48亿参数JoyAI-LLM-Flash,轻量化大模型赛道再迎新玩家 2月14日,京东在全球知名AI开源平台Hugging Face正式推出其最新研发的大模型JoyAI-LLM-Flash。这款总参数达48亿、激活参数仅3亿的轻量化模型,历经20万亿文本Token预训练,凭借独创的Fi...

1 个月前
京东开源48亿参数JoyAI-LLM-Flash,突破大模型规模化瓶颈 2月14日,京东在全球知名AI开发者社区Hugging Face正式开源最新大语言模型JoyAI-LLM-Flash。这款模型以48亿总参数搭配3亿激活参数的轻量化设计,历经20万亿文本Token预训练,在...

39 分钟前
近日,人工智能企业OpenAI正式宣布关停旗下AI视频生成工具Sora。该产品2024年2月首次亮相时,曾凭借最高生成60秒4K分辨率连贯视频的能力引发行业震动,上线后累计有超12万创作者获得测试资格。本次关停并未如外界最初猜测一般源于版权纠纷,而是与模型训练成本高企、商用化落地不及预期直接相关。

41 分钟前
斯坦福大学人机交互实验室近日发布专项研究结果,针对ChatGPT、Google Gemini、DeepSeek等12款主流生成式AI聊天机器人的测试显示,其在医疗、财务、个人职业选择等高风险决策场景的平均错误率达37%,专家明确提示普通用户不应将AI聊天机器人作为个人决策的唯一参考依据,需对其输出内容保持审慎验证态度。

43 分钟前
微软近期正式上线AI协作工具Copilot Cowork,搭载全新升级的智能研究引擎,可自动扫描用户工作文档、项目材料中的逻辑漏洞、数据缺失及论证空白,目前已向Office 365商业版用户开放灰度测试。据内部测试数据显示,该工具可帮助职场用户减少42%的跨部门信息核对时间,项目前期漏洞排查效率提升近60%。

44 分钟前
近日,家用智能设备厂商Beatbot正式发布面向泳池护理场景的Sora系列机器人,产品搭载边缘端AI视觉模型,可自主识别水体杂质、规划清洁路径,清洁覆盖率较传统自动清洁设备提升47%。与此同时,OpenAI、Google、DeepSeek等主流大模型厂商均在加速布局智能家居赛道,AItoC落地场景边界正在持续扩容。

47 分钟前
近期苹果公司旗下原生AI功能Apple Intelligence在国内iOS 18开发者预览版用户设备中短暂现身,上线仅数小时后便被快速关停。作为苹果首款端云协同大模型服务,Apple Intelligence此前官宣仅面向欧美英语市场率先推送,本次意外曝光也引发业内对其中国区落地进程、监管适配进度的广泛讨论。

49 分钟前
近日海外科技媒体披露,苹果正计划在iOS 27系统中进一步整合自研AI服务Apple Intelligence能力,重点优化常年被用户吐槽易用性差的快捷指令App,降低自动化操作的配置门槛。当前iOS快捷指令的复杂操作劝退超6成普通用户,本次AI升级有望实现自然语言生成指令、自动适配操作场景等功能,预计2025年6月WWDC大会正式亮相。