京东开源48亿参数JoyAI-LLM-Flash,轻量化大模型赛道再迎新玩家
2月14日,京东在全球知名AI开源平台Hugging Face正式推出其最新研发的大模型JoyAI-LLM-Flash。这款总参数达48亿、激活参数仅3亿的轻量化模型,历经20万亿文本Token预训练,凭借独创的FiberPO优化框架等技术突破,为大模型在中小场景的落地提供了新的可行路径,也为全球开源AI生态注入了来自电商场景的实践经验。
不同于多数企业对大模型采取闭门研发或定向授权的策略,京东此次直接将JoyAI-LLM-Flash推向开源社区,这一动作在AI商业化与技术普惠的平衡中显得颇为亮眼。从参数配置来看,48亿总参数的规模虽不及百亿、千亿级的超大型模型,但3亿激活参数的设计,是其核心竞争力之一——这意味着模型在保持通用能力的同时,大幅降低了部署和运行的资源门槛,无需依赖顶级算力集群,甚至能在边缘设备或中小服务器上流畅运行,为中小企业和垂直场景的AI应用落地铺平了道路。
20万亿文本Token的预训练量,为JoyAI-LLM-Flash筑牢了扎实的性能基础。覆盖互联网文本、专业文档、电商语料等多领域的大规模输入,让模型具备了更广泛的知识储备和语言理解能力:既能应对日常对话、信息查询等通用场景,也能快速适配电商客服、商品推荐、供应链预测等垂直领域的定制化需求,这一点与京东自身的业务场景形成了天然的协同性。
真正让这款模型脱颖而出的,是其底层技术架构的创新突破。京东自研的FiberPO优化框架首次将数学领域的纤维丛理论引入强化学习环节,通过构建高维空间的映射关系,有效解决了传统大模型在规模扩展时易出现的训练不稳定、精度波动等行业共性问题。搭配专属的Muon优化器和稠密多Token预测(MTP)技术,模型的推理效率得到质的提升——官方测试数据显示,与非MTP版本相比,JoyAI-LLM-Flash的吞吐量提升超过100%,这意味着在相同算力投入下,它能处理更多并发请求,响应速度更快,进一步压缩了AI应用的落地成本。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
9 小时前
近期凭借OpenClaw(俗称“小龙虾”)插件走红的国产大模型MiniMax 2.7,官方于2026年4月7日确认将于本周末在Hugging Face社区发布开源版本。该模型3月18日上线后调用量长期位居行业前列,SWE-Pro基准测试得分达56.22%接近顶尖闭源模型水平,开源后将大幅降低开发者Token调用成本,利好下游AI应用落地。

13 小时前
近日谷歌正式发布全开源Gemma4系列大模型,该系列通过底层架构创新实现性能跨级跃升,其中最小激活参数量仅3.8亿的版本,性能超越参数规模20倍的同类大模型。Gemma4覆盖2.3B到31B多参数档位,可直接部署于手机、轻薄本等消费级终端,将大幅降低通用AI落地门槛。

4 天前
2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。

4 天前
2026年4月3日,谷歌DeepMind正式发布新一代开源大模型系列Gemma4,本次迭代距上一代产品发布间隔一年,不仅将开源协议更换为支持免费商用的Apache2.0,还推出4款覆盖端侧到数据中心的不同规格产品,其中310亿参数旗舰版性能位列Arena AI开源排行榜第三,单张H100显卡即可运行。

4 天前
北京时间2026年4月3日,谷歌正式推出全新开源大模型Gemma4,该系列基于Gemini3技术栈打造,共包含2.3B、4.5B高效版及26B MoE、31B稠密版四种规格,全系支持多模态输入,高效版原生支持端侧实时语音理解,31B稠密版本在Arena AI文本榜单中位列全球开源模型第三,大幅降低前沿AI能力的本地部署门槛。

4 天前
2026年4月3日,谷歌正式发布新一代开源AI模型Gemma4,放弃此前Gemma系列采用的限制性自定义许可,改用行业通用的Apache2.0开源协议,允许全球开发者自由使用、修改、分发模型并用于商用场景。该模型在性能与生态兼容性上实现双重升级,可大幅降低AI落地的技术与法律门槛。

5 天前
2026年4月,谷歌DeepMind首席执行官Demis Hassabis通过社交平台暗示,新一代开源大模型Gemma 4即将正式发布。该模型参数规模达120B,为上代Gemma 3的4倍,采用MoE混合专家架构,激活参数仅15B,有望在民用级显卡实现本地离线运行。谷歌意在借这款产品,从中国厂商主导的开源大模型市场夺回话语权。

12 天前
欧洲头部开源大模型厂商Mistral于2026年3月26日推出全新开源语音生成模型,该模型无需依赖云端算力,可直接在智能手表、智能手机等消费级端侧设备运行,填补了轻量开源语音生成模型的市场空白,为端侧语音交互应用开发提供了更低门槛的解决方案,预计将推动智能设备语音体验升级。