2026年4月24日,国产AI芯片厂商寒武纪宣布完成对深度求索(DeepSeek)最新开源大模型DeepSeek-V4全系列的Day0适配工作,适配覆盖参数规模285B的Flash版本与1.6T的Pro版本,项目基于vLLM推理框架开发,通过自研算子库完成核心模块专项优化,相关适配优化代码已开源至GitHub社区,实现新模型发布当日即可在寒武纪MLU硬件上稳定运行。
近年来开源大模型的迭代速度持续提升,头部模型厂商平均每几个月就会推出能力更强、参数规模更大的新一代底座模型,Day0适配(即新模型发布当日就完成硬件平台的适配优化),已经成为衡量AI芯片厂商生态服务能力的核心指标。
对于企业开发者而言,新模型发布后不能快速在自有算力上部署,往往会错过产品迭代的黄金窗口,这对芯片厂商的技术响应速度和架构优化能力都提出了极高要求。
本次适配覆盖DeepSeek-V4全系列产品,不仅包括主流的285B参数Flash版,也涵盖了当前业界少见的1.6T超大参数Pro版,适配复杂度远超常规中小规模模型。针对DeepSeek-V4独有的稀疏注意力与压缩结构,寒武纪依托自研Torch-MLU-Ops算子库对Compressor等核心模块完成了专项加速。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
16 分钟前
据科技圈最新一级市场交易消息,埃隆·马斯克旗下太空探索技术公司SpaceX已提出价值600亿美元的收购要约,计划收购热门AI原生代码编辑器Cursor。本次交易若达成,将成为AI开发工具领域近年规模最大的并购案,也将进一步扩充马斯克的全球AI产业布局,引发业内对AI赛道估值与行业格局变动的广泛讨论。

46 分钟前
近日,前OpenAI研究科学家主导研发的全新生成式AI大模型正式推出,该项目由腾讯支持落地。与此同时,国内大模型创业公司DeepSeek也发布了迭代升级的全新旗舰大模型。近期国内生成式AI赛道动作频频,头部科技企业与前沿创业机构同步推进技术更新,行业产品迭代速率明显加快,竞争格局正迎来新的变化。

1 小时前
2026年4月,苹果旗下紧凑型台式电脑Mac mini因成为个人用户运行本地AI大模型的热门选择,市场需求暴增后出现全渠道缺货情况。第三方交易平台eBay现已出现大量加价转卖的Mac mini货源,多款全新、二手机型溢价幅度明显高于常规二级市场水平,这一缺货现象也侧面反映出个人本地AI部署需求的快速增长。

2 小时前
2026年4月,专注AI编程赛道的初创公司Cursor启动新一轮大额融资,给出500亿美元的预期估值。此前SpaceX曾传出有意以600亿美元整体收购Cursor,但此次融资对接中,包括Iconiq在内的多家顶级后期投资机构均明确拒绝投资,业内将遇冷归因于全球AI资本已完成向OpenAI、Anthropic等头部巨头的初期布局,投资情绪整体转向审慎。

2 小时前
2026年4月24日,国产AI领军企业DeepSeek正式发布新一代旗舰大模型DeepSeek V4,本次发布采用细分化产品策略,推出DeepSeek-V4-Flash、DeepSeek-V4-Pro双版本,分别覆盖轻量高频应用与复杂推理两类核心场景,整合了原有deepseek-chat与deeps...

2 小时前
2026年4月24日,中国大模型开发商深度求索(DeepSeek)正式发布全新DeepSeek-V4系列大语言模型预览版,并同步开放源码。该系列实现了1M(百万字)超长上下文能力的标准化,分为Pro、Flash双版本覆盖不同需求,其中1.6T总参数的Pro版性能对标顶级闭源模型,整体推理、Agent协作能力处于国内及开源领域领先位置。

2 小时前
2026年4月24日,A股上市公司万兴科技正式为旗下创意绘图产品万兴脑图(原亿图脑图)上线全新AI功能——万兴脑图AI,升级后的产品成为国内首款支持AI Agent技术的专业思维导图软件,目前该功能正处于公开测试阶段,依托对话驱动的AI知识工作台,在保留原有手绘创作模式的基础上优化知识管理流程,有望进一步提升办公与学习场景的生产效率。

2 小时前
2026年4月,成立51年的微软首次面向美国部分员工推出一次性自愿退休买断计划,是AI浪潮推动下科技行业人员结构调整的最新标志性事件。据微软内部备忘录披露,此次计划覆盖年龄加工龄达70岁及以上的合格员工,共约8750人,占微软美国员工总数的7%,微软首席人事官艾米・科尔曼同时披露了配套薪酬体系改革方案。