
2026年3月,国内AGI厂商MiniMax与腾讯云宣布达成深度技术合作,双方联合研发的Agent强化学习(RL)沙箱已完成测试阶段全量平稳运行。该沙箱具备百万级吞吐、十万级并发能力,标志着AI智能体落地的底层基建能力实现重要突破,为后续大规模智能体训练、全场景商业化落地提供了核心支撑。
过去一年,AI智能体的商业化落地进程明显提速,但多数落地场景仍停留在单节点、小批量部署阶段,一旦要实现万级以上规模的智能体协同训练,底层算力调度、训练环境构建的短板就会快速暴露。
作为提升AI智能体决策能力的核心技术,强化学习需要为智能体构建高拟真的模拟训练环境,支持智能体在环境中不断试错迭代。但传统训练方案普遍存在环境搭建周期长、算力资源利用率低、并发支撑能力不足等问题,百万级规模的智能体“大练兵”此前几乎是行业空白。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录