英伟达Blackwell架构获DeepSeek R1验证:能效吞吐量较Hopper提升50倍 2月16日,英伟达公布其最新Blackwell Ultra AI架构(GB300 NVL72)的关键测试数据:通过大语言模型DeepSeek-R1的实际运行验证,该架构每兆瓦吞吐量较前代Hopper GPU提升50倍,每百万tokens推理成本降至仅为前者的35分之一。此外,英伟达还预告了下一代Rubin算力平台,其能效吞吐量将较Blackwell再提升10倍,为AI基础设施演进指明新方向。 随着大语言模型向万亿参数级、多模态融合方向快速迭代,算力成本与能效瓶颈正成为制约AI产业规模化落地的核心痛点。此前,英伟达Hopper架构凭借领先的算力密度,成为全球多数AI大模型训练与推理的首选平台,但高昂的电力消耗与运营成本,仍让不少中小AI企业望而却步。而Blackwell架构的测试结果,无疑为这一困境提供了突破性的解决方案。 此次测试选择DeepSeek-R1作为基准模型,并非偶然。作为当前大语言模型赛道的高性能代表,DeepSeek-R1以其复杂的模型结构和高算力需求,被行业视为检验AI芯片真实...