知情人士透露,DeepSeek V4或于下周正式发布,这款大模型将全程基于国产芯片完成训练与推理,并针对华为昇腾、寒武纪思元系列芯片深度优化。此前DeepSeek V3.1已推出适配下一代国产芯片的定制格式,华为Atlas 950 SuperPoD算力规模达前代20多倍,此次软硬协同有望大幅提升国产AI生态竞争力,缩小与国际巨头的差距。
当国际AI巨头凭借“大模型+专属芯片”的闭环生态持续巩固优势时,国产AI领域正通过“底层算力+上层模型”的深度绑定,探索自主可控的突围路径。近日有知情人士爆料,深度求索(DeepSeek)旗下新一代大语言模型DeepSeek V4或于下周正式亮相,这将成为国产AI生态在软硬协同赛道的标志性事件。
不同于此前多数国产大模型依赖海外芯片完成核心训练环节,DeepSeek V4将实现全程基于国产芯片完成训练与推理的突破,并且针对华为昇腾、寒武纪思元两大国产主流芯片系列进行了深度适配优化。
这一布局并非突发之举,早在DeepSeek V3.1版本发布时,团队就推出了为下一代国产芯片定制的UE8M0 FP8格式,为大模型与国产算力的兼容打下技术基础。而此次V4版本的落地,将直接把这种技术铺垫转化为实际的生态竞争力,让国产大模型不再受限于海外算力底座的制约。
大模型的落地离不开强大算力的支撑,华为今年推出的Atlas 950 SuperPoD系列正是国产算力底座的核心代表。这款超节点集群支持8192张昇腾芯片,整体规模达到前代产品的20多倍,满配状态下占地约1000平方米,可实现FP8算力8E FLOPS、FP4算力16E FLOPS的极致性能,互联带宽更是达到16PB/s,足以支撑千亿甚至万亿参数大模型的高效训练。
这样的算力升级,不仅为DeepSeek V4的发布提供了坚实的硬件基础,也标志着国产算力集群已经具备了对标国际顶级水平的能力,为后续更多国产大模型的规模化落地扫清了硬件障碍。
长期以来,国产AI领域的发展多聚焦于单点突破——要么是芯片厂商独立攻坚,要么是大模型团队单独迭代,但这种分散式的发展模式很难形成合力,在面对国际巨头的闭环生态时往往处于被动。
而DeepSeek V4与国产芯片的深度绑定,以及华为Atlas集群的算力支撑,正是国产AI生态转向体系化竞争的关键信号。当大模型能够充分发挥国产芯片的性能,芯片厂商的技术迭代也能反向推动大模型的优化,这种正向循环将逐步构建起自主可控的国产AI生态,大幅缩小与国际巨头的差距,为国产AI在全球市场争取更多话语权。

4 分钟前
2026年3月3日,荣耀正式宣布智能体基础模型MagicAgent面向全球开源。该模型由荣耀联合复旦大学人工智能实验室共同研发,是YOYO智能体的核心底层大脑,主打全场景泛化规划与异构任务编排,为行业首个支持该特性的基础模型。官方披露,MagicAgent在六大核心性能测试中全面领先GPT-5.2,此次开源将为智能体技术的场景落地提供新的支撑。

5 分钟前
伦敦国王学院安全研究中心肯尼斯·佩恩教授团队发布最新实证研究,针对GPT 5.2、Gemini 3 Flash、Claude Sonnet 4三款当前应用广泛的前沿大语言模型开展核危机模拟测试,结果显示95%的模拟场景中,模型会选择发出核威慑或升级冲突,而非通过外交对话和平解决,该发现凸显AI用于国家战略决策的潜在伦理与安全风险。

7 分钟前
2026年3月,阿里巴巴发布并开源四款千问(Qwen)3.5小尺寸大模型,涵盖0.8B、2B、4B、9B参数量,覆盖边缘设备、轻量Agent、服务器端部署场景,9B版本性能媲美GPT-OSS-120B。发布后引爆AI社区,马斯克在社交平台点赞,称其智能密度令人印象深刻。

13 分钟前
伴随大模型技术突破,DeepSeek、豆包等AI工具已成为不少家长的孩子私教,可完成答疑、批改作业等基础教育服务,但AI学习机赛道并未被冲击。2025年中国学习平板市场全渠道销量达632.1万台,同比增长6.7%。科大讯飞近日推出T90 Pro学习机,依托自研大模型打造个性化学习方案,重新定义AI教育硬件的核心价值。

15 分钟前
2026年3月,社交平台𝕏和GitHub代码仓库先后流出OpenAI内部大模型的泄露线索:在Codex代码助手的版本变更记录、交互界面中,先后出现GPT-5.4的标识,后续虽被临时改为gpt-5.3-codex,但种种细节显示这款内部测试模型已进入收尾测试阶段。据泄露的零散信息,该模型或瞄准200万Tokens上下文窗口、原生高清图像理解两大核心能力,引发AI行业对OpenAI新动作的广泛讨论。

17 分钟前
2026年世界移动通信大会(MWC)展区俨然成为中国AI企业的集中展示舞台,其中小米携全新AI落地方案成为焦点。依托跻身全球开源大模型第一梯队的技术底座,叠加10亿级人车家终端生态规模,小米首次将AI从手机文字交互延伸至物理世界,实现跨设备协同运转,成为本届展会最具讨论度的AI落地样本。

19 分钟前
2026年3月,阿里通义千问团队在X平台正式发布Qwen3.5小模型系列,覆盖0.8B、2B、4B、9B四种参数规格的轻量化大语言模型。上线即引发海外科技圈强烈反响,特斯拉CEO马斯克随即在相关推文下留言称赞,这款仅9B参数的小模型对标120B级大模型的表现,打破了“大参数才是强AI”的固有认知,成为近期AI领域焦点事件。

22 分钟前
2026年3月3日,智东西对外报道阿里正式开源Qwen3.5系列四款小尺寸大语言模型,覆盖0.8B、2B、4B、9B四个参数档位,其中9B版本性能宣称超越GPT-5 nano,可直接部署于笔记本电脑等轻量化端侧设备。该消息曝光后,马斯克公开发文惊叹其表现,不少国内网友已开始研究将模型移植至iPhone等移动终端,端侧AI落地话题再度升温。