少找工具,多做创作

DeepSeek V4或下周发布,软硬件协同攻坚国产AI算力生态

知情人士透露,DeepSeek V4或于下周正式发布,这款大模型将全程基于国产芯片完成训练与推理,并针对华为昇腾、寒武纪思元系列芯片深度优化。此前DeepSeek已推出适配下一代国产芯片的UE8M0 FP8格式,而华为今年推出的Atlas 950 SuperPoD算力集群支持8192张昇腾卡,FP8算力达8E FLOPS,软硬件协同有望强化国产AI生态竞争力。

据知情人士消息,国内AI企业深度求索(DeepSeek)的新一代大语言模型DeepSeek V4发布时间已进入倒计时,最快下周就将与外界见面。区别于过往版本,DeepSeek V4将实现从训练到推理全流程的国产芯片适配,尤其针对华为昇腾、寒武纪思元系列芯片进行了定制化优化,这意味着这款大模型将完全脱离海外算力底座,构建起真正的本土AI技术闭环。

此前DeepSeek推出的V3.1版本,已公布专为下一代国产芯片打造的UE8M0 FP8计算格式,这一技术铺垫为V4版本的软硬件协同打下了核心基础。通过定制化的计算框架,大模型能够精准匹配国产芯片的硬件特性,避免通用格式下的性能损耗,进一步释放本土算力的潜力。

大模型的迭代升级离不开底层算力的强力支撑,华为今年推出的Atlas 950 SuperPoD算力集群,恰好为DeepSeek V4这类大模型提供了坚实的硬件底座。根据公开信息,该集群可支持8192张昇腾芯片,整体规模是前代产品的20多倍,满配状态下占地约1000平方米,FP8精度算力可达8E FLOPS,FP4精度算力更是达到16E FLOPS,集群互联带宽高达16PB/s。

这一算力集群的落地,是华为此前公布的超节点集群路线图的关键成果。从单卡算力突破到集群规模的指数级扩容,华为正在构建覆盖从基础算力到场景应用的完整国产算力生态,既为大语言模型训练等重算力需求场景提供高性价比解决方案,也为本土AI企业摆脱对外来算力的依赖创造了条件。

在国际AI巨头构建的软硬件闭环生态下,国产AI产业长期面临技术依赖与“卡脖子”风险。而DeepSeek V4与国产芯片的深度绑定,加上华为算力集群的协同支撑,有望形成“国产芯片-国产算力集群-国产大模型”的完整自主链条,打破此前的技术壁垒。

相较于国际主流大模型依赖特定海外硬件平台的现状,DeepSeek V4的路线选择更具针对性——通过深度适配国产芯片,最大化发挥本土算力的性能优势,同时降低大模型部署与应用的综合成本。若这款大模型顺利发布,将进一步提升国产大语言模型的整体竞争力,推动国内AI产业在自主可控的道路上迈出关键一步。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
所属分类
相关资讯