少找工具,多做创作

阿里发布千问3.6-Plus大模型 百万上下文编程能力登顶国产直逼Claude

2026年4月2日,阿里巴巴正式发布新一代大语言模型千问3.6-Plus。该模型配备100万token长上下文窗口,在多项权威编程评测中位居国产模型首位,整体编程能力接近全球标杆Claude系列,可自主完成前端开发、复杂仓库任务、设计稿转网页等需求,被业内称为当前最强国产编程大模型。

随着企业级数字化开发需求的爆发,编程大模型已经成为近两年AI厂商的核心角力领域。此前海外Anthropic推出的Claude系列凭借极强的长上下文处理能力和编程精度,长期占据全球编程大模型的榜首位置,国产模型虽然迭代速度快,但在复杂工程任务处理、长代码库理解上始终存在明显差距。

国内云服务、互联网企业对自主可控AI编程工具的需求持续攀升,也倒逼国产大模型厂商加快技术迭代,千问3.6系列正是阿里达摩院瞄准这一市场空白定向研发的核心产品。

此次发布的千问3.6-Plus针对编程场景做了多层定向优化,多项核心参数已经达到国际一流水平。
在通用编程能力上,该模型在HumanEval、MBPP等全球通用编程评测集上的通过率,相比前代千问3.5提升超25%,所有指标均领跑国产大模型,仅以不到3%的差距落后于Claude 3 Opus的编程专项得分。
针对工程级开发需求,千问3.6-Plus配备了100万token的长上下文窗口,可以一次性载入整个中型项目的全量代码库,不用分段上传就能完成全仓库的逻辑理解、bug排查和功能迭代。同时模型已经实现了开发全流程自主化,不需要人类工程师分步引导,就能自主完成从需求拆解、代码编写、测试迭代到bug修复的完整闭环,复杂仓库任务的完成率从3.5版本的47%提升至82%。
依托原生多模态数据训练,该模型还打通了从设计稿到可运行页面的全链路:用户上传Figma设计稿、页面截图甚至是手绘的原型图,模型都可以直接输出符合规范的前端代码,还原度超过90%。

性能的大幅提升也让千问3.6-Plus的商用落地速度远超此前的迭代版本。目前该模型已经开放API调用接口,面向企业级用户提供定制化部署服务。据阿里达摩院相关负责人透露,千问3.6-Plus已经在阿里内部的电商前端开发、云服务运维等场景落地测试,相同开发需求下,工程师的人均效率提升超40%,复杂bug的排查时间从平均2小时缩短至15分钟以内。

业内分析认为,这款模型的推出将打破海外大模型在高端编程场景的垄断,为国内中小软件研发团队提供成本更低、适配性更强的AI开发工具,后续随着多模态编程能力的进一步优化,有望覆盖更多工业级开发场景。

AI生成配图

(图像由AI生成)

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创