登录体验完整功能(收藏、点赞、评论等)

英伟达收购SchedMD 开源AI调度工具Slurm走向引行业担忧

英伟达近期完成对开源集群调度工具Slurm的开发主体SchedMD的收购,引发全球AI计算领域对开源工具商业独立性的广泛讨论。据行业调研数据,当前全球超70%的AI训练GPU集群采用Slurm作为调度核心,其中近六成集群搭载多品牌异构GPU,此次收购后Slurm的开源属性与路线适配性成为企业用户核心关切。

此次收购的标的SchedMD是Slurm项目的核心开发与维护主体,成立以来始终保持中立运营,此前Slurm作为开源项目可同时适配英伟达、AMD、英特尔等多家厂商的GPU与加速芯片,是AI训练、超算领域应用最广泛的调度工具之一。

对于动辄调度数千张GPU协同运行的大模型训练任务而言,调度系统的效率直接决定了训练周期的长短和算力资源的利用率,其地位相当于AI计算集群的“操作系统内核”。

Slurm凭借高稳定性、异构兼容能力和开源免费的特性,已经成为全球AI算力设施的标配工具,**全球Top500超算中超过60%的设施采用Slurm调度系统**。过去几年不少企业为了避免单一厂商的硬件绑定,特意采购多品牌GPU组建异构集群,Slurm的中立适配能力是这类集群正常运行的核心前提。

英伟达此前对外公开表态称,收购完成后将继续保持Slurm的开源属性,不会限制其对其他厂商硬件的适配能力,但不少企业技术负责人仍表示担忧——在英伟达占据全球AI GPU市场超80%份额的前提下,SchedMD的技术研发优先级难免向大股东倾斜。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创