近日,AI基础设施研发商MoonMath AI正式开源适配AMD MI300X加速卡的bf16精度HIP注意力内核。该内核完全基于HIP异构计算语言开发,在所有输入形状、所有舍入模式的测试场景中,性能均全面领先现有主流优化方案AITER v3,将为AMD生态下大模型训练与推理的性能提升提供新的开源工具选择。
作为大模型训练与推理流程中占算力消耗比重超40%的核心模块,注意力算子的优化效率直接决定了AI加速卡的实际落地表现。在当前AMD算力生态快速扩张的背景下,第三方厂商的底层优化贡献正在成为生态完善的核心动力。
随着生成式AI产业的高速扩张,全球AI算力供给长期处于紧缺状态,叠加英伟达高端加速卡的供应限制与成本高企问题,越来越多的云服务商与AI企业开始布局AMD MI300X算力集群。公开数据显示,2026年上半年AMD MI300系列加速卡的出货量同比增长超过300%,但其软件生态的优化进度始终跟不上硬件普及速度。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录