2026年4月24日,国产AI芯片厂商寒武纪宣布完成对深度求索(DeepSeek)最新开源大模型DeepSeek-V4全系列的Day0适配工作,适配覆盖参数规模285B的Flash版本与1.6T的Pro版本,项目基于vLLM推理框架开发,通过自研算子库完成核心模块专项优化,相关适配优化代码已开源至GitHub社区,实现新模型发布当日即可在寒武纪MLU硬件上稳定运行。
近年来开源大模型的迭代速度持续提升,头部模型厂商平均每几个月就会推出能力更强、参数规模更大的新一代底座模型,Day0适配(即新模型发布当日就完成硬件平台的适配优化),已经成为衡量AI芯片厂商生态服务能力的核心指标。
对于企业开发者而言,新模型发布后不能快速在自有算力上部署,往往会错过产品迭代的黄金窗口,这对芯片厂商的技术响应速度和架构优化能力都提出了极高要求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录