AI基础设施初创公司Prime Intellect于近期正式发布开源训练框架prime-rl 0.6.0版本,该版本针对智能体强化学习(Agentic RL)工作负载深度优化,首次实现万亿参数规模混合专家模型(MoE)的高效训练,依托FP8低精度计算、分离式推理架构,同硬件下训练吞吐量较现有主流方案提升37%,为超大规模通用AI智能体的研发提供了全新底层工具支撑。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。