登录体验完整功能(收藏、点赞、评论等)

Cursor发布自研编码模型Composer 2 跑分超Claude Opus引热议

2026年3月19日,代码编辑器开发商Cursor正式上线自研编码模型Composer 2,官方公布的Terminal-Bench 2.0测试数据显示,该模型代理式终端编码任务得分达61.7%,较Anthropic旗下旗舰大模型Claude Opus 4.6同环境下的58.0%高出3.7个百分点,相关跑分结果公布后迅速在AI编码及开发者社区引发广泛讨论与争议。

3月19日Cursor的官方公告发布后不到半小时,GitHub开发者讨论区、X平台科技板块相关话题的热度就冲上了热榜前三,不少常年使用Cursor的开发者第一时间推送版本更新测试新功能,有全栈开发者晒出的实测记录显示,用Composer 2完成从需求梳理到项目部署的全流程开发任务,效率比此前调用Claude Opus 4.6接口时提升了近40%。

过去几年,AI编码工具的核心能力基本由通用大模型厂商主导,包括Cursor在内的多数IDE产品,都选择接入OpenAI GPT系列、Anthropic Claude系列的通用大模型提供编码补全、调试、代理开发等功能,垂直工具厂商很少投入资源自研底层大模型。

此次Composer 2的跑分结果,是IDE厂商自研编码模型首次在公认核心基准上超越通用大模型厂商的旗舰产品,也打破了外界对“垂直厂商自研模型能力不及通用大模型”的固有认知。

此次Cursor采用的Terminal-Bench 2.0是AI编码领域公认的高含金量基准测试,不同于常规的单代码片段补全测试,它主要考核模型理解复杂开发需求、自主调用终端工具、排查运行报错、完成全流程开发任务的综合能力,更贴近开发者的真实使用场景。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创