登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

寒武纪完成DeepSeek-V4全系列Day0适配 开源优化代码

2026年4月24日,国产AI芯片厂商寒武纪宣布完成对深度求索(DeepSeek)最新开源大模型DeepSeek-V4全系列的Day0适配工作,适配覆盖参数规模285B的Flash版本与1.6T的Pro版本,项目基于vLLM推理框架开发,通过自研算子库完成核心模块专项优化,相关适配优化代码已开源至GitHub社区,实现新模型发布当日即可在寒武纪MLU硬件上稳定运行。

近年来开源大模型的迭代速度持续提升,头部模型厂商平均每几个月就会推出能力更强、参数规模更大的新一代底座模型,Day0适配(即新模型发布当日就完成硬件平台的适配优化),已经成为衡量AI芯片厂商生态服务能力的核心指标。

对于企业开发者而言,新模型发布后不能快速在自有算力上部署,往往会错过产品迭代的黄金窗口,这对芯片厂商的技术响应速度和架构优化能力都提出了极高要求。

本次适配覆盖DeepSeek-V4全系列产品,不仅包括主流的285B参数Flash版,也涵盖了当前业界少见的1.6T超大参数Pro版,适配复杂度远超常规中小规模模型。针对DeepSeek-V4独有的稀疏注意力与压缩结构,寒武纪依托自研Torch-MLU-Ops算子库对Compressor等核心模块完成了专项加速。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创