2026年4月24日,国内AI芯片企业寒武纪宣布完成对深度求索最新开源大语言模型DeepSeek-V4的Day 0适配,实现模型发布当日即可在寒武纪MLU硬件平台上稳定运行。寒武纪通过自研融合算子库Torch-MLU-Ops对模型核心模块做针对性加速,结合vLLM推理框架的多项优化,在满足延迟要求的同时显著提升推理效率,为下游用户快速部署大模型提供支持。
Day 0适配指的是在大模型正式对外发布的同一天,就完成硬件层面的全流程适配优化并实现稳定运行,对于需要快速跟进最新大模型能力的行业用户来说,这一能力直接缩短了新技术从发布到落地的周期。此前多数AI硬件厂商完成一款新晋开源大模型的适配通常需要3至7天不等的开发周期,寒武纪此次实现DeepSeek-V4的发布当日适配,彻底填补了用户等待适配的空窗期,拿到模型即可快速部署。
此次适配并非简单的移植,寒武纪针对DeepSeek-V4的架构特性做了多层定制优化。其依托自主研发的Torch-MLU-Ops融合算子库,对模型特有的Compressor、mHC等核心模块做了专门的算子重构与融合,解决了通用算子适配效率不足的问题,从底层实现计算加速。
在推理框架层面,寒武纪深度适配了主流的vLLM推理框架,完整支持张量并行(TP)、流水线并行(PP)、序列并行(SP)等多种并行计算方案,同时实现了通信计算重叠、低精度量化、预填充与解码分离(PD分离)部署等多项工程优化。针对大模型推理普遍存在的访存瓶颈,技术团队还进一步挖掘MLU架构的硬件特性,通过优化访存排序,实现了稀疏注意力模块的计算提速,最终在满足业务端延迟约束的前提下,显著提升了模型的整体推理吞吐量。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
19 分钟前
据科技圈最新一级市场交易消息,埃隆·马斯克旗下太空探索技术公司SpaceX已提出价值600亿美元的收购要约,计划收购热门AI原生代码编辑器Cursor。本次交易若达成,将成为AI开发工具领域近年规模最大的并购案,也将进一步扩充马斯克的全球AI产业布局,引发业内对AI赛道估值与行业格局变动的广泛讨论。

49 分钟前
近日,前OpenAI研究科学家主导研发的全新生成式AI大模型正式推出,该项目由腾讯支持落地。与此同时,国内大模型创业公司DeepSeek也发布了迭代升级的全新旗舰大模型。近期国内生成式AI赛道动作频频,头部科技企业与前沿创业机构同步推进技术更新,行业产品迭代速率明显加快,竞争格局正迎来新的变化。

1 小时前
2026年4月,苹果旗下紧凑型台式电脑Mac mini因成为个人用户运行本地AI大模型的热门选择,市场需求暴增后出现全渠道缺货情况。第三方交易平台eBay现已出现大量加价转卖的Mac mini货源,多款全新、二手机型溢价幅度明显高于常规二级市场水平,这一缺货现象也侧面反映出个人本地AI部署需求的快速增长。

2 小时前
2026年4月,专注AI编程赛道的初创公司Cursor启动新一轮大额融资,给出500亿美元的预期估值。此前SpaceX曾传出有意以600亿美元整体收购Cursor,但此次融资对接中,包括Iconiq在内的多家顶级后期投资机构均明确拒绝投资,业内将遇冷归因于全球AI资本已完成向OpenAI、Anthropic等头部巨头的初期布局,投资情绪整体转向审慎。

2 小时前
2026年4月24日,国产AI领军企业DeepSeek正式发布新一代旗舰大模型DeepSeek V4,本次发布采用细分化产品策略,推出DeepSeek-V4-Flash、DeepSeek-V4-Pro双版本,分别覆盖轻量高频应用与复杂推理两类核心场景,整合了原有deepseek-chat与deeps...

2 小时前
2026年4月24日,中国大模型开发商深度求索(DeepSeek)正式发布全新DeepSeek-V4系列大语言模型预览版,并同步开放源码。该系列实现了1M(百万字)超长上下文能力的标准化,分为Pro、Flash双版本覆盖不同需求,其中1.6T总参数的Pro版性能对标顶级闭源模型,整体推理、Agent协作能力处于国内及开源领域领先位置。

2 小时前
2026年4月24日,A股上市公司万兴科技正式为旗下创意绘图产品万兴脑图(原亿图脑图)上线全新AI功能——万兴脑图AI,升级后的产品成为国内首款支持AI Agent技术的专业思维导图软件,目前该功能正处于公开测试阶段,依托对话驱动的AI知识工作台,在保留原有手绘创作模式的基础上优化知识管理流程,有望进一步提升办公与学习场景的生产效率。

2 小时前
2026年4月,成立51年的微软首次面向美国部分员工推出一次性自愿退休买断计划,是AI浪潮推动下科技行业人员结构调整的最新标志性事件。据微软内部备忘录披露,此次计划覆盖年龄加工龄达70岁及以上的合格员工,共约8750人,占微软美国员工总数的7%,微软首席人事官艾米・科尔曼同时披露了配套薪酬体系改革方案。