2026年4月20日,国内头部AI创业公司月之暗面正式发布并开源全新大模型Kimi K2.6。该模型在衡量软件工程能力的SWE-Bench Pro、评估智能体检索能力的DeepSearchQA两项核心基准测试中,性能比肩GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro等国际顶尖闭源模型,在长程任务处理、Agent集群协同领域实现突破性进展。
国内大模型赛道的竞争正在从通用能力比拼,转向垂直场景落地能力的近身肉搏。过去一年间,代码生成、智能体(Agent)集群协同两大方向,成为各大厂商抢占企业级服务市场的核心抓手,头部玩家的技术迭代速度已经从季度级缩短至月度级。
相比早已进入性能瓶颈期的通用对话能力,代码生成与智能体能力的天花板更高,商业落地空间也更为清晰。一方面,代码大模型能够直接降低软件工程的人力成本,单模型就能覆盖从需求分析、代码编写到测试调试的全流程,是当下To B市场付费意愿最强的AI服务品类;另一方面,具备集群协同能力的智能体,被业内视为实现通用人工智能(AGI)的核心路径之一,一旦落地就能够重构企业的工作流。此前这两大领域的技术高地几乎被海外闭源模型垄断,国内开源模型始终存在1-2代的技术代差。
此次发布的Kimi K2.6直接填补了这一空白。官方披露的测试数据显示,在SWE-Bench Pro测试中,Kimi K2.6的正确率达到了47.2%,与GPT-5.4的48.1%、Claude Opus 4.6的47.6%基本持平,远超此前国内开源模型最高32%的成绩;而在针对智能体长程检索能力的DeepSearchQA测试中,该模型的得分更是超过Gemini 3.1 Pro2.3个百分点,位列全球第一梯队。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年4月,谷歌正式推出面向B端的Gemini Enterprise Agent Platform智能体构建工具,该产品并未跟风当前主流的面向全岗位非技术用户的低代码路径,而是定向适配IT、开发等技术类用户需求,成为企业级AI工具赛道差异化布局的代表性新品,引发行业对企业智能体产品定位逻辑的新一轮讨论。

1 小时前
近期科技巨头Meta被曝出正在研发一套基于大语言模型与多模态计算机视觉技术的新型用户监控体系,该方案可跨Instagram、Facebook、WhatsApp三大平台抓取用户全量行为数据并自动标记风险行为,测试数据显示其行为识别准确率达92%,相关计划曝光后迅速引发全球隐私保护组织、科技从业者的集体质疑,被批为“反乌托邦式的技术滥用”。

3 小时前
谷歌近日正式发布办公智能组件Workspace Intelligence,依托旗下Gemini大语言模型的多模态理解与逻辑推理能力,可打通Gmail、Google Docs、日历、云盘等全系列Workspace生态数据,实现日程智能调度、跨文档信息整理、多应用任务自动执行等功能。据谷歌内部测试数据,该工具可帮助办公人员减少约37%的低价值重复事务处理时间,目前已面向企业级客户开放邀测通道。

3 小时前
谷歌近期为旗下大语言模型产品Gemini推送全新办公集成功能,用户无需切换应用,在Gemini聊天界面即可调用Google Workspace能力生成文档、幻灯片、表格,还能直接创建日历会议邀请,目前该功能已向所有付费版及免费版用户逐步开放,大幅降低了AI工具落地日常办公场景的操作门槛。

3 小时前
2026年4月22日,人工智能头部企业OpenAI与全球IT服务巨头Infosys宣布达成深度战略合作,双方将整合OpenAI的大模型技术能力与Infosys的企业服务落地经验,面向全球企业客户推出定制化AI工具,首批落地覆盖软件工程、遗留系统现代化、DevOps三大场景,预计可帮助企业研发流程提效35%左右,大幅降低数字化转型门槛。

5 小时前
2026年4月举办的谷歌云Next年度大会上,谷歌面向全球开发者、企业客户与创投群体集中展示了数十家入驻谷歌云生态的AI初创企业,覆盖大语言模型垂直应用、多模态推理、AI基础设施等多个核心赛道,此举被业内视为谷歌云强化AI生态壁垒、对抗AWS、微软Azure竞争的核心动作,相关项目的技术落地进度引发广泛关注。

5 小时前
美国航天科技企业SpaceX近期已取得AI编码初创公司Cursor的收购选择权,整体交易对价约为60亿美元。SpaceX官方披露,交易完成后将把Cursor的专属AI编码模型与旗下Colossus超级计算机深度整合,该消息一出即引发大量企业级客户对Cursor后续模型中立性、数据服务合同条款变更的普遍担忧。

7 小时前
2026年4月22日,国内大模型厂商DeepSeek宣布旗下API正式升级至百万Token上下文版本,容量较此前的128k版本提升近7倍,同步将内置知识库更新至2025年5月,非联网状态下可覆盖对应时间节点的信息查询。创始人梁文锋此前曾透露新一代旗舰大模型研发进展,本次升级也被视作新模型落地前的重要技术铺垫。