2026年3月17日举办的GTC2026开发者大会上,英伟达创始人黄仁勋正式揭晓下一代AI加速平台Vera Rubin。该平台采用台积电3纳米制程工艺,集成3360亿颗晶体管,FP4推断算力达前代Blackwell平台的5倍,标志着英伟达从单一芯片供应商向全栈AI工厂基础设施服务商转型,将大幅降低混合专家大模型的训练与部署门槛。
作为全球AI产业的年度风向标,每年GTC大会的新品发布环节都被业内视为未来2-3年AI算力的走势锚点,今年黄仁勋揭晓的Rubin平台,刚一亮相就引发了超算服务商、大模型研发厂商的集体关注。
从硬件参数来看,Rubin平台的性能提升远超行业此前预期。其核心GPU采用台积电3nm先进制程,集成3360亿颗晶体管,核心性能较上一代Blackwell平台提升60%以上。
该平台首创的「六芯协同」架构重构了超算的硬件标准:单个超级芯片集成1颗Vera CPU与2颗Rubin GPU,同时搭载288GB HBM4高速内存,内存带宽高达22TB/s,可支撑超大规模大模型参数的高速调用。在实际性能表现上,Rubin平台的FP4推断算力达到50PFLOPS,是Blackwell平台的5倍,每瓦特性能更是提升了10倍,这也意味着大模型厂商训练混合专家模型(MoE)的算力成本将出现明显下降。
值得注意的是,此次英伟达将新平台命名为Vera Rubin,正是致敬此前发现暗物质存在证据的知名天文学家薇拉·鲁宾,延续了英伟达用顶尖科学家命名核心算力产品的传统。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
12 小时前
2026年以来,美国加州AI算力集群用电需求同比上涨42%,带动全州平均电价上浮18%。此前长期为硅谷度假胜地太浩湖供电的太平洋燃气电力公司合约将于今年年底到期,受AI用电缺口挤压,其续约报价较此前上涨37%,迫使太浩湖市政部门启动新一轮能源供应商招标,优先考虑可稳定供电的清洁能源服务商。

13 天前
受上游存储厂商产能不足影响,2024年第三季度全球GDDR6显存缺口已突破22%,直接制约AI推理、PC游戏等场景的显卡供给。芯片巨头英伟达近期被曝正评估重启RTX 30系列GPU量产的可行性,以低成本产品填补中低端算力市场的供给空白,应对当前的内存供应危机。

13 天前
当前OpenAI、Google Gemini等大模型的端侧部署需求持续攀升,AI算力缺口不断扩大。此前业界曾提出太空数据中心的构想试图解决集中式算力的痛点,但受成本、技术限制始终无法落地。近期海外科技领域探索出将微型算力节点部署在城市路灯杆上的新路径,单节点可承载15TOPS AI推理算力,可实现10毫秒以内的低时延响应。

14 天前
当地时间2026年5月1日,美国国防部(五角大楼)正式宣布与英伟达、微软、亚马逊云科技(AWS)达成合作协议,将在军方涉密网络内部署定制化商用AI技术。本次合作是五角大楼此前与AI企业Anthropic就模型使用条款产生争议后,首次大规模拓展AI供应商阵营,将覆盖情报分析、战术推演等多个核心军用场景。

16 天前
2026年4月30日三星电子公布2026年第一季度财报,营业利润达57.2万亿韩元,同比涨幅超750%创历史新高,营收达133.9万亿韩元同比增长约70%,远超市场预期。本次业绩爆发核心驱动力为AI领域算力需求暴涨,带动高附加值存储芯片价格上涨,英伟达等厂商对高带宽内存(HBM)的旺盛需求也进一步推高三星存储业务营收。

16 天前
2026年4月披露的最新财报显示,亚马逊旗下云业务AWS第一季度营收达287亿美元,同比增长22%,超出市场此前预期的18%增速。亚马逊CEO安迪·贾西明确表示,未来12个月将持续加大AI相关资本开支,总投入预计超500亿美元,重点投向AI芯片、数据中心扩建及云AI工具研发,以应对爆发的企业级AI服务需求。

16 天前
2026年4月29日披露的谷歌云最新季度财报显示,其单季度营收首次突破200亿美元大关,核心增长动力来自企业级AI训练、推理算力服务的爆发式需求。谷歌云官方坦言,当前算力产能不足直接限制了业务增速,若产能充足该季度营收还将实现更高幅度增长。

17 天前
2026年4月29日,英伟达正式发布开放式多模态大模型Nemotron 3 Nano Omni,采用30B-A3B混合专家架构,原生集成音视觉编码器无需额外感知模型,推理效率较传统方案提升9倍,在复杂文档解析、音视频理解等领域表现优异,跻身六大权威评测榜单前列,H Company首席执行官Gautier Cloix称其为智能体技术的重要突破。