Cursor推出Composer1.5 强化学习规模扩20倍实现性能跃迁 2月10日,知名AI辅助编程工具团队Cursor正式发布新一代智能编码模型Composer1.5。相较于前代产品,该模型通过将强化学习后训练规模扩大20倍,实现了推理深度、响应速度及复杂长任务处理能力的多重突破,其后期训练计算量甚至超过基础模型预训练阶段,为全球开发者带来更高效的智能编码解决方案。 作为AI辅助编程赛道的头部玩家,Cursor凭借初代Composer模型的出色表现,已成为众多开发者提升编码效率的核心工具。此次发布的Composer1.5并未推翻原有预训练架构,而是在关键的后训练阶段投入了量级级技术资源——将强化学习(RL)的训练规模提升至前代的20倍。这一调整并非简单的算力堆砌,而是通过大规模人类反馈强化学习(RLHF),让模型在贴近真实开发场景的任务中反复迭代,逐步优化代码生成的准确性、逻辑性与贴合度。 据Cursor官方披露,Composer1.5的后训练计算量已超过其基础模型的初始预训练计算量,足见团队在模型优化上的投入力度。这种高强度训练直接转化为可感知的性能提升:在推理深度层面,新模型能...