登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

月之暗面开源Kimi K2.6大模型 核心能力追平国际顶尖闭源产品

2026年4月20日,国内头部AI创业公司月之暗面正式发布并开源全新大模型Kimi K2.6。该模型在衡量软件工程能力的SWE-Bench Pro、评估智能体检索能力的DeepSearchQA两项核心基准测试中,性能比肩GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro等国际顶尖闭源模型,在长程任务处理、Agent集群协同领域实现突破性进展。

国内大模型赛道的竞争正在从通用能力比拼,转向垂直场景落地能力的近身肉搏。过去一年间,代码生成、智能体(Agent)集群协同两大方向,成为各大厂商抢占企业级服务市场的核心抓手,头部玩家的技术迭代速度已经从季度级缩短至月度级。

相比早已进入性能瓶颈期的通用对话能力,代码生成与智能体能力的天花板更高,商业落地空间也更为清晰。一方面,代码大模型能够直接降低软件工程的人力成本,单模型就能覆盖从需求分析、代码编写到测试调试的全流程,是当下To B市场付费意愿最强的AI服务品类;另一方面,具备集群协同能力的智能体,被业内视为实现通用人工智能(AGI)的核心路径之一,一旦落地就能够重构企业的工作流。此前这两大领域的技术高地几乎被海外闭源模型垄断,国内开源模型始终存在1-2代的技术代差。

此次发布的Kimi K2.6直接填补了这一空白。官方披露的测试数据显示,在SWE-Bench Pro测试中,Kimi K2.6的正确率达到了47.2%,与GPT-5.4的48.1%、Claude Opus 4.6的47.6%基本持平,远超此前国内开源模型最高32%的成绩;而在针对智能体长程检索能力的DeepSearchQA测试中,该模型的得分更是超过Gemini 3.1 Pro2.3个百分点,位列全球第一梯队。

!
信息及评测声明: 本文部分信息整理自互联网公开资料,并包含由 AI创作导航 团队独立进行的实测体验。我们力求内容客观准确,但因工具功能、价格及政策可能存在实时调整,所有信息仅供参考,请务必在使用前访问官网确认。文中观点不构成任何决策建议,读者需自行评估和承担使用风险。如发现内容有误或侵权,欢迎随时反馈,我们将及时核实处理。
相关资讯
AI小创