当地时间2026年3月30日,有“HBM之父”之称的韩国科学技术院电气与电子工程学院教授金正浩公开对外表态,当前以英伟达GPU为核心的AI芯片体系即将发生根本性变革,未来高带宽内存(HBM)、高带宽闪存(HBF)将成为计算核心,GPU与CPU将退居配角,这一预判也引发全球半导体行业对存算一体架构落地节奏的广泛讨论。
当前AI产业正处于从生成式AI向AI智能体跃迁的关键节点,大模型参数规模动辄突破万亿级,训练和推理过程中数据传输需求呈指数级上涨,GPU算力释放频繁被内存带宽瓶颈限制,这一被业内称为“内存墙”的难题,已经成为AI算力升级的头号阻碍。
过去几年,英伟达凭借GPU硬件+CUDA软件生态的组合,占据了全球AI算力市场超过80%的份额,当前几乎所有主流大模型的训练和推理都基于英伟达GPU集群展开。但随着AI应用对实时性、能效比的要求越来越高,传统“GPU计算+内存存储”的分离式架构短板愈发明显:数据在GPU和内存之间来回传输的延迟,能占到整个AI计算任务延迟的70%以上,功耗占比也超过60%,投入产出比持续走低。
作为HBM技术的核心发明者,金正浩的观点在半导体领域拥有极高的权威性。他明确提出,未来AI芯片的核心将从GPU转向内存侧,GPU和CPU都会作为协处理器,被整合进HBM、HBF的封装体系中,实现计算和存储的深度融合,从根源上解决数据传输带来的延迟和功耗问题。这种架构变革,恰好适配AI智能体多任务并行、低延迟响应的需求,能把当前AI计算的能效比提升10倍以上。
事实上,整个半导体行业已经在为这场架构变革做准备。三星、SK海力士两大存储巨头已经开始研发集成计算单元的存算一体HBM原型产品,预计2028年左右实现量产;英伟达也在推进3D堆叠封装技术,缩小GPU和HBM之间的物理距离,提升数据传输效率;国内存储厂商长鑫存储、长江存储也早已布局存算一体相关技术专利,抢占下一代AI芯片的话语权。
不过金正浩也坦言,内存主导的AI芯片架构不会立刻取代现有GPU体系,整个过渡周期大概在5到10年左右。最大的阻碍并非硬件技术,而是现有软件生态的适配:当前绝大多数AI框架、算子都基于CUDA生态开发,想要迁移到新的内存计算架构上,需要整个行业上下游的协同调整,短期内通用AI计算场景仍会以GPU架构为主。

(图像由AI生成)

1 小时前
2026年4月,中国信通院基于新发布的《云端OpenClaw基线能力要求》开展首批安全评估,腾讯公司公关总监张军披露,旗下龙虾特攻队系列的WorkBuddy、QClaw、轻量云OpenClaw、云桌面云手机Claw、ClawPro共5款产品全部通过评估,覆盖功能可信、收费可控等五大核心安全维度,为国内AI龙虾类产品落地树立了安全合规标杆。

1 小时前
2026年4月1日消息,高德正式全量开源全球首个基于统一架构的具身操作基座模型ABot-M0。该模型可作为“通用大脑”适配多种形态的具身机器人,在Libero、Libero-Plus等多个权威基准测试中达到SOTA表现,其中在Libero-Plus基准上任务成功率达80.5%,较此前业界标杆方案Pi0提升近30%。

1 小时前
国内大模型厂商智谱日前发布2025年全年业绩公告,全年营收达7.24亿元,同比增长131.9%,经调整净亏损31.82亿元,同比扩大29.1%。其最新推出的GLM-5发布24小时内即获字节、阿里、腾讯等头部大厂接入,国内前10大互联网公司已有9家深度集成GLM系列模型,旗下GLM Coding Plan付费开发者规模突破24.2万。

2 小时前
2026年4月,AI智能体与自动化框架OpenClaw正式发布v2026.3.31版本,俗称“龙虾”框架的该平台首次原生捆绑腾讯QQ机器人作为内置渠道插件。本次更新免去了开发者此前依赖第三方桥接工具的接入流程,实现QQ生态全覆盖,支持多账号配置、安全凭证管理等功能,大幅降低AI智能体接入社交场景的开发门槛。

2 小时前
2026年4月,华为面向内测用户推送HarmonyOS 6负一屏应用「智慧助手·今天」15.0.22.210测试版本,首次接入Claw智能体能力,新增AI任务提醒、晨间简报、AI搜索、通勤动态提醒等多项功能,覆盖日程管理、信息查询、场景化服务等多个日常场景,为鸿蒙生态的端侧AI交互落地新增核心入口。

2 小时前
美国科技巨头Meta近日公布新一代超算级AI数据中心Hyperion的配套能源方案,将新建10座天然气发电厂为其专属供能,整体发电容量达1.2GW,足以覆盖美国南达科他州全州的民生与工业用电需求,该方案也引发行业对AI算力能耗与清洁能源转型路径的广泛讨论。

4 小时前
近日,专注于AI辅助半导体设计的初创企业Cognichip宣布完成6000万美元新一轮融资。该公司核心产品为面向AI算力芯片的全流程AI原生设计工具链,官方测试数据显示其可将芯片研发成本降低75%以上,研发周期缩短超50%,本次融资将主要用于技术迭代、团队扩张及商业化落地,有望破解AI算力芯片研发成本高、周期长的行业痛点。

9 小时前
2026年4月,AI创企Anthropic旗下闭源编程工具Claude Code意外泄露引发行业震荡,项目负责人鲍里斯·切尔尼公开承认团队手动操作部署流程失误导致事故,第三方基于泄露代码推出的平替版本上线后短时间内便斩获GitHub 10万星,Anthropic随后紧急启动下架封杀措施,此次事件也引发行业对闭源AI项目安全管控的广泛讨论。