我可以帮您推荐合适的AI工具,有什么需要帮忙的吗?
英伟达研究团队于2026年5月28日发布开源AI框架Polar,支持现有代码智能体框架Codex、Claude Code、Qwen Code等无缝接入广义相对策略优化(GRPO)强化学习技术,无需改动原有工具调用、上下文组织逻辑,实测可使Codex性能提升近600%,大幅降低代码智能体的强化学习训练落地门槛。

---
当前代码智能体已经成为AI赛道的核心布局方向,OpenAI Codex、Anthropic Claude Code、通义Qwen Code等产品已广泛落地代码补全、缺陷修复等场景,但性能优化长期面临瓶颈:监督学习只能拟合已有样本,难以适配多步决策的复杂开发任务;强化学习虽能通过奖励信号迭代策略,却要求重构智能体的工具调用、上下文管理等核心模块,改造成本极高,中小研发团队普遍无力承担。
英伟达此次推出的Polar框架,核心价值就是解决了强化学习的兼容难题。框架采用外挂式调度层设计,不需要改动原有智能体的工具调用、上下文组织、补丁提交流程,就能直接接入广义相对策略优化(GRPO)训练方案。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录