近日智谱联合驭驯网络与清华大学团队研发的ZCube组网架构正式落地GLM-5.1 coding生产环境,该成果此前已在网络领域顶级学术会议ACM SIGCOMM2025发表。实测数据显示,在GPU、软件栈与上层应用完全不变的前提下,大模型推理吞吐提升15%,网络相关资本支出削减33%,首Token时延降低超四成,为大模型算力基建降本提效提供了全新可行路径。
2026年整个AI行业的竞争焦点已经从“堆参数堆算力”转向“单位算力的效能挖掘”,随着长上下文推理普及、Prefill-Decode分离部署成为行业主流,跨节点的KV Cache传输流量呈现出极强的非对称性,传统通用组网架构的冗余设计开始拖慢整个算力集群的运行效率。
过去几年大量厂商快速扩容万卡级GPU集群时,普遍将预算重心放在GPU卡采购上,默认沿用传统为对称通用流量设计的CLOS多层交换网络。但随着大模型推理的流量特征快速演变,这套组网架构的适配性漏洞开始凸显:大量为均衡流量预留的带宽资源被闲置,反而需要采购大量高端交换机、高速光模块来应对峰值突发流量,网络相关投入的占比甚至攀升到整个算力集群成本的30%以上。
更值得注意的是,无效的跨节点数据排队还会进一步拉高传输时延,很多算力集群的GPU实际利用率长期徘徊在40%-50%区间,接近三分之一的性能损耗都来自数据传输环节的拖慢,网络已经成了释放大模型算力潜能的核心瓶颈。
针对这一行业共性痛点,智谱、驭驯网络与清华大学组成的产学研团队早在2025年9月就完成了ZCube组网架构的原型研究,相关成果被网络领域顶会ACM SIGCOMM2025收录,直到2026年5月完成生产环境全量适配,最终落地在智谱面向代码生成场景的GLM-5.1 coding业务集群中。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 分钟前
近日网易有道于2026年5月正式推出子曰4.0全模态大模型,以全量开源为核心定位向开发者社区开放全部核心技术资产,其27B参数版本在数理推理任务上达到行业SOTA顶尖水平,同时完成自研翻译引擎的底层重构,有望大幅降低中小开发者的AI落地成本,推动国内全模态大模型生态的普惠化发展。

4 分钟前
2026年5月谷歌正式官宣搜索引擎重大改版,推出由自研Gemini 3.5 Flash大模型驱动的全新智能搜索框,将传统关键词匹配式搜索全面升级为支持多模态交互的对话式体验。本次改革首次将谷歌搜索平台打造为全链路生成式AI工具统一入口,凭借上下文记忆、需求预判等特性,将直接影响全球数十亿用户的日常信息获取习惯。

6 分钟前
2026年5月,谷歌宣布在旗下AI Mode人工智能搜索模式中测试全新广告体系,依托Gemini大模型为赞助商品生成定制化购买理由解释模块,同时上线搭载内置Gemini聊天机器人的交互广告。该更新在谷歌推出支持长对话查询的全新搜索框次日落地,标志着Gemini能力正式全面渗透至谷歌核心商业广告板块,将直接重构搜索场景下的用户消费转化路径。

8 分钟前
2026年5月最新披露消息,美国五角大楼网络作战部门正式组建专项AI工作组,该工作组由国家安全局与网络司令部负责人约书亚·拉德将军在两周前通过内部邮件官宣成立,核心目标是应对当前私营部门AI模型漏洞探测速度超越顶级黑客的安全风险,推动先进AI工具在涉密敏感网络中安全落地,相关部署也将配合白宫正在起草的AI大模型前置强制测试行政命令同步推进。

10 分钟前
2026年,OpenAI、Anthropic、Google三家全球顶级AI厂商先后启动特定岗位扩招计划,引入源自Palantir的前置部署工程师成熟人才体系,瞄准当下大模型向企业端渗透过程中普遍存在的落地适配差、需求响应慢的行业痛点,计划年内将该类岗位团队规模扩充至原有编制的3倍以上,补齐To B服务的最后一公里能力短板。

32 分钟前
国内头部大模型企业月之暗面(Kimi)近期正式启动赴港上市筹备工作,作为行业“AI六小龙”核心成员,企业已向全体股东通报拆除VIE与红筹架构的计划,过去半年累计融资总额达39亿美元,当前整体估值突破200亿美元,有望成为首批登陆港交所的国内原生大模型创业公司。

34 分钟前
企业财务软件龙头Intuit于2026年5月官宣重组计划,将裁减约17%的员工共超3000人,本次调整并非出于财务困境,核心目标是集中资源向AI产品研发与整合环节倾斜,CEO萨桑·古达尔齐表示将通过简化组织架构加速AI战略落地,弥补此前股价跑输标普500的市场差距,带动旗下TurboTax、QuickBooks等核心产品完成全链路智能化迭代。

36 分钟前
持续靠资本输血维持运营的通用大模型赛道近期迎来标志性转折点,总部位于旧金山的AI初创企业Anthropic最新披露,有望在2026年第二季度实现成立以来首个盈利季度,单季度营收达109亿美元,营业利润约5.59亿美元,商业化进度大幅领先OpenAI、xAI等同赛道头部玩家,打破了市场对头部大模型厂商需长期烧钱的固有认知。