登录体验完整功能(收藏、点赞、评论等) — 已累计有 12155 人加入

MoonMath AI开源AMD MI300X专属HIP注意力内核 性能超AITER v3

详情页推荐

近日,AI基础设施研发商MoonMath AI正式开源适配AMD MI300X加速卡的bf16精度HIP注意力内核。该内核完全基于HIP异构计算语言开发,在所有输入形状、所有舍入模式的测试场景中,性能均全面领先现有主流优化方案AITER v3,将为AMD生态下大模型训练与推理的性能提升提供新的开源工具选择。

作为大模型训练与推理流程中占算力消耗比重超40%的核心模块,注意力算子的优化效率直接决定了AI加速卡的实际落地表现。在当前AMD算力生态快速扩张的背景下,第三方厂商的底层优化贡献正在成为生态完善的核心动力。

随着生成式AI产业的高速扩张,全球AI算力供给长期处于紧缺状态,叠加英伟达高端加速卡的供应限制与成本高企问题,越来越多的云服务商与AI企业开始布局AMD MI300X算力集群。公开数据显示,2026年上半年AMD MI300系列加速卡的出货量同比增长超过300%,但其软件生态的优化进度始终跟不上硬件普及速度。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。