算力军备赛白热化 国内超3万卡国产AI算力池落地核心节点

5 小时前 AI快讯 4

算力军备赛白热化 国内超3万卡国产AI算力池落地核心节点

当OpenAI与马斯克旗下xAI在全球AI算力军备赛中加速布局超级算力集群时,国内AI算力领域传来重磅突破。2月5日,中科曙光提供的3套scaleX万卡超集群系统在国家超算互联网核心节点同步上线试运行,这是国内首次在国家级算力枢纽同时部署运营3套万卡级AI超集群,直接构建起全国最大的国产AI算力池,为国内大模型研发、通用AI落地筑牢关键算力底座。

在全球AI竞赛的赛道上,算力早已脱离“基础设施”的单一定位,成为决定大模型迭代速度、通用AI落地深度的核心壁垒。近期,OpenAI为推进GPT-4o及后续迭代版本研发,持续加码超大规模算力集群的投入;马斯克则公开表示,xAI正构建能支撑万亿参数模型训练的超级算力网络,全球AI算力军备赛的热度持续升温——每一次算力规模的突破,都意味着大模型性能跃迁的可能性,也拉开了不同研发主体的技术代差。

在此背景下,国内超大规模国产AI算力的落地,无疑是对全球算力格局的一次重要补位。据了解,此次上线的3套scaleX万卡超集群系统,单集群规模达到万卡级别,三者同步落地后总算力规模超3万卡,不仅创下国内国家级算力枢纽同时部署万卡级AI超集群的纪录,更凭借全链路国产化的技术架构,打破了超大规模AI算力依赖进口方案的传统局面。

中科曙光的scaleX超集群架构,是专为大模型分布式训练优化的定制化方案,具备高效的多集群协同调度能力,可支撑千亿甚至万亿参数大模型的并行训练需求。业内AI算力专家分析指出,单套万卡集群已能满足主流大模型的训练需求,而同时上线3套万卡集群的意义不止于规模翻倍:这种部署模式既可以通过算力池化调度提升资源利用率,为不同行业的AI应用场景按需分配算力;也能通过多集群冗余设计,保障大模型训练、AI行业应用的连续稳定性,避免因单点故障导致的研发中断。

从产业价值来看,这一国产AI算力池的落地,将为国内AI生态带来三重关键支撑:其一,为国内大模型研发团队提供低成本、高可靠的国产算力选项,缓解此前部分机构因进口算力芯片供应受限带来的研发压力;其二,依托国家超算互联网的网络优势,该算力池可实现跨区域算力调度,覆盖从京津冀、长三角到粤港澳的核心AI产业集群,支撑AI在智能制造、智慧医疗、智慧城市等领域的深度落地;其三,推动国产算力生态的闭环构建,带动国产算力芯片、存储系统、调度软件等上下游环节的技术迭代,进一步强化国内AI产业的自主可控能力。

当前,通用AI的竞争已从算法创新延伸至算力基础设施的全面比拼。随着国内最大国产AI算力池的落地,国内AI产业在全球算力军备赛中拿到了关键的“砝码”。未来,随着国家超算互联网的持续扩容,更多超大规模国产算力集群有望陆续上线,为国内AI产业从技术研发到产业化落地的全链条发展,注入源源不断的核心动力。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创