2026年3月19日,代码编辑器开发商Cursor正式上线自研编码模型Composer 2,官方公布的Terminal-Bench 2.0测试数据显示,该模型代理式终端编码任务得分达61.7%,较Anthropic旗下旗舰大模型Claude Opus 4.6同环境下的58.0%高出3.7个百分点,相关跑分结果公布后迅速在AI编码及开发者社区引发广泛讨论与争议。
3月19日Cursor的官方公告发布后不到半小时,GitHub开发者讨论区、X平台科技板块相关话题的热度就冲上了热榜前三,不少常年使用Cursor的开发者第一时间推送版本更新测试新功能,有全栈开发者晒出的实测记录显示,用Composer 2完成从需求梳理到项目部署的全流程开发任务,效率比此前调用Claude Opus 4.6接口时提升了近40%。
过去几年,AI编码工具的核心能力基本由通用大模型厂商主导,包括Cursor在内的多数IDE产品,都选择接入OpenAI GPT系列、Anthropic Claude系列的通用大模型提供编码补全、调试、代理开发等功能,垂直工具厂商很少投入资源自研底层大模型。
此次Composer 2的跑分结果,是IDE厂商自研编码模型首次在公认核心基准上超越通用大模型厂商的旗舰产品,也打破了外界对“垂直厂商自研模型能力不及通用大模型”的固有认知。
此次Cursor采用的Terminal-Bench 2.0是AI编码领域公认的高含金量基准测试,不同于常规的单代码片段补全测试,它主要考核模型理解复杂开发需求、自主调用终端工具、排查运行报错、完成全流程开发任务的综合能力,更贴近开发者的真实使用场景。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
5 分钟前
印度人工智能初创企业Rocket于近期正式发布全新智能咨询平台,该平台跳出传统AI工具聚焦代码生成的限制,整合战略规划、产品搭建、竞争情报三大核心能力,可输出对标麦肯锡等头部咨询公司的专业分析报告,而服务成本仅为传统咨询的几分之一,大幅降低了中小微企业获取专业决策支持的门槛。

2 小时前
根据全球大模型聚合平台OpenRouter2026年4月发布的监测数据,2026年3月30日至4月5日中国AI大模型周调用量达12.96万亿Token,环比增长31.48%,是美国同期调用量的4倍以上。全球大模型周调用量榜单前六均为国产模型,阿里旗下Qwen3.6系列、小米MiMo-V2-Pro分列前三,凸显中国AI应用端的规模领先优势。

2 小时前
2026年4月7日,全球存储巨头三星电子发布2026年第一季度初步业绩预告,预计营业利润达57.2万亿韩元(约合379.2亿美元),较去年同期增长8倍以上,远超分析师预期的40.6万亿韩元。此轮业绩暴涨核心动力为生成式AI基础设施建设带来的存储芯片需求激增,存储价格大幅上涨推动行业彻底走出此前的下行周期。

2 小时前
2026年4月,西班牙卫星初创公司Xoople宣布完成1.3亿美元B轮融资,本轮由Nazca Capital领投,西班牙科技发展基金CDTI等机构参投。公司专注为AI模型提供地面真值数据源,CEO Fabrizio Pirondini称其专用卫星星座采集的数据精度较现有系统提升两个数量级,目前已接入微软、Esri等企业级平台生态。

2 小时前
根据全球AI模型分发平台OpenRouter2026年4月7日发布的监测数据,中国AI大模型周调用量已连续五周超越美国,2026年3月30日至4月5日当周达12.96万亿Token,环比增长31.48%,占全球总调用量近五成。阿里巴巴Qwen系列、小米MiMo-V2-Pro等产品表现突出,中国厂商包揽全球大模型周调用量榜单前六位。

3 小时前
2026年4月,Ted Entertainment、Matt Fisher、Golfholics三家YouTube频道共同发起集体诉讼,指控苹果、亚马逊、OpenAI绕过平台反爬虫机制,非法下载数百万条视频数据用于AI模型训练,争议核心为包含数千万训练样本的Panda-70M数据集,本次诉讼也被视为AI音视频训练数据版权纠纷的标志性案件。

3 小时前
谷歌近期正式推出旗下全新免费AI听写应用,基于Gemini大模型语音模块训练优化,支持多语种混合识别、离线输入等功能。该产品被业内认定为付费听写工具Willow的核心替代选项,上线首周全球下载量突破120万次,92%的首批用户给出四星以上评分,有望改写消费级语音输入工具的现有市场格局。

3 小时前
2026年美国职场出现名为FOBO(Fear of Becoming Obsolete,即被淘汰恐惧)的新型职场心理。毕马威调研显示,40%员工将AI导致的失业作为主要焦虑源,63%受访者认为AI让工作环境更缺乏人性。Anthropic CEO达里奥·阿莫代伊、微软AI CEO穆斯塔法·苏莱曼等行业人士均提示AI对白领岗位的替代风险,当前岗位技能需求迭代速度较一年前提升66%。