登录体验完整功能(收藏、点赞、评论等) — 已累计有 8645 人加入

让AI触手可及,让应用激发潜能

蚂蚁联合清华开源AReaL系统 AI推理训练最高提速2.77倍

3月4日,蚂蚁集团与清华大学联合正式开源大规模异步强化学习训练框架AReaL v1.0稳定版。该系统通过解耦数据生成与模型训练流程,打破了传统同步训练机制的算力瓶颈,可显著提升大语言模型尤其是推理模型的训练效率,实测AI推理训练速度最高可达2.77倍,为大模型逻辑推理能力升级提供了高效技术路径。

当前大语言模型正从通用对话向大规模推理模型(LRM)迭代,这类模型需要更强的逻辑推演、复杂问题拆解能力,而强化学习(RL)正是实现这一升级的关键技术。但目前主流的RL训练系统多采用同步运行模式,数据生成与模型训练需严格按批次推进,容易出现算力闲置、训练周期过长的问题。

这套被业内称为“边用边训”的高效框架,核心突破在于解耦了数据生成与模型训练的流程。传统同步训练机制需要等待全部训练数据生成完毕后,才能启动模型迭代,极易造成分布式算力的空转浪费。而AReaL通过异步调度机制,让数据生成与模型训练两个环节并行推进,充分释放算力潜力,实测显示该系统可让AI推理模型的训练速度最高提升2.77倍,大幅缩短了大模型推理能力的迭代周期。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创