2026年3月19日,代码编辑器开发商Cursor正式上线自研编码模型Composer 2,官方公布的Terminal-Bench 2.0测试数据显示,该模型代理式终端编码任务得分达61.7%,较Anthropic旗下旗舰大模型Claude Opus 4.6同环境下的58.0%高出3.7个百分点,相关跑分结果公布后迅速在AI编码及开发者社区引发广泛讨论与争议。
3月19日Cursor的官方公告发布后不到半小时,GitHub开发者讨论区、X平台科技板块相关话题的热度就冲上了热榜前三,不少常年使用Cursor的开发者第一时间推送版本更新测试新功能,有全栈开发者晒出的实测记录显示,用Composer 2完成从需求梳理到项目部署的全流程开发任务,效率比此前调用Claude Opus 4.6接口时提升了近40%。
过去几年,AI编码工具的核心能力基本由通用大模型厂商主导,包括Cursor在内的多数IDE产品,都选择接入OpenAI GPT系列、Anthropic Claude系列的通用大模型提供编码补全、调试、代理开发等功能,垂直工具厂商很少投入资源自研底层大模型。
此次Composer 2的跑分结果,是IDE厂商自研编码模型首次在公认核心基准上超越通用大模型厂商的旗舰产品,也打破了外界对“垂直厂商自研模型能力不及通用大模型”的固有认知。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录