登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

国产GPU新突破:摩尔线程S5000适配中国移动九天大模型

在即将开幕的第九届数字中国建设峰会上,中国移动将首次公开展示自研的“九天”35B通用大模型,国产GPU厂商摩尔线程近日宣布,旗下旗舰GPU MTT S5000已完成对该模型的全流程适配与推理验证。该产品基于第四代MUSA架构打造,单卡AI稠密算力达1000TFLOPS,配备80GB大容量显存,这是国产算力软硬件生态协同的重要突破。

近年来国内大模型产业迎来爆发期,百余家厂商推出了从百亿到千亿参数级别的各类大模型,但产业化落地始终绕不开一道坎——算力的自主可控。长期以来,国内大模型的开发、推理部署高度依赖海外厂商的GPU产品,供应链波动不仅推高了行业成本,也给面向政务、金融等关键领域的大模型应用带来了潜在风险。

对于中国移动这类承担国家算力网络建设任务的龙头企业而言,打造全自主可控的大模型算力底座,早已成为明确的发展目标。此次即将公开亮相的九天35B通用大模型,是中国移动面向千行百业打造的核心通用模型,已经完成了多轮行业场景测试,对算力底座的性能、可靠性都提出了极高要求,国产GPU的成熟适配是其规模化落地的必要前提。

不同于行业内部分小参数模型的浅度适配验证,此次摩尔线程完成的是35B参数级别大模型的全流程适配与推理验证,实现了从模型开发到部署上线的全链路打通。摩尔线程依托自研的MUSA软件栈,搭配专门优化的SGLang-MUSA高性能推理引擎,对模型推理的各个环节做了协同定制:开发层面通过MUSA C框架、muDNN计算库、MATE开源算子库的联动,针对大模型核心的注意力机制和长文本推理需求做了专门调优。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创