受上游存储厂商产能不足影响,2024年第三季度全球GDDR6显存缺口已突破22%,直接制约AI推理、PC游戏等场景的显卡供给。芯片巨头英伟达近期被曝正评估重启RTX 30系列GPU量产的可行性,以低成本产品填补中低端算力市场的供给空白,应对当前的内存供应危机。
十一假期之后,国内DIY硬件市场的中端显卡报价已经连续三周走高,RTX 4060的均价较上月上浮近15%。不少下游品牌商透露,本次涨价的核心诱因并非终端需求爆发,而是上游GDDR6显存供应不足,显存颗粒的拿货价较二季度已经上涨了近三成。
本次显存供应紧张,本质上是游戏与AI两大赛道的需求叠加所致。游戏端,今年《黑神话:悟空》等3A大作集中上线,带动玩家更换显卡的需求同比上涨47%;AI端,消费级显卡已经成为轻量AI推理场景的主流硬件选择,不少中小团队为降低部署成本,放弃专业计算卡转而采购RTX系列消费级显卡运行DeepSeek、Llama 3等开源大模型,即便是Copilot、Apple Intelligence这类消费端AI功能,在本地运行时也对显存容量有明确要求,进一步推高了显存消耗量。
选择重启RTX 30系列GPU,并非英伟达的临时之举。从硬件参数来看,RTX 30系列采用成熟的GDDR6显存方案,相比RTX 40系列使用的GDDR6X显存,产能更充足、采购成本更低;同时,12GB显存版本的RTX 3060可以流畅运行7B-13B参数的开源大模型4bit量化版本,完全满足中小团队本地AI部署、普通玩家2K分辨率游戏的需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
16 小时前
当前OpenAI、Google Gemini等大模型的端侧部署需求持续攀升,AI算力缺口不断扩大。此前业界曾提出太空数据中心的构想试图解决集中式算力的痛点,但受成本、技术限制始终无法落地。近期海外科技领域探索出将微型算力节点部署在城市路灯杆上的新路径,单节点可承载15TOPS AI推理算力,可实现10毫秒以内的低时延响应。

1 天前
当地时间2026年5月1日,美国国防部(五角大楼)正式宣布与英伟达、微软、亚马逊云科技(AWS)达成合作协议,将在军方涉密网络内部署定制化商用AI技术。本次合作是五角大楼此前与AI企业Anthropic就模型使用条款产生争议后,首次大规模拓展AI供应商阵营,将覆盖情报分析、战术推演等多个核心军用场景。

3 天前
2026年4月30日三星电子公布2026年第一季度财报,营业利润达57.2万亿韩元,同比涨幅超750%创历史新高,营收达133.9万亿韩元同比增长约70%,远超市场预期。本次业绩爆发核心驱动力为AI领域算力需求暴涨,带动高附加值存储芯片价格上涨,英伟达等厂商对高带宽内存(HBM)的旺盛需求也进一步推高三星存储业务营收。

3 天前
2026年4月披露的最新财报显示,亚马逊旗下云业务AWS第一季度营收达287亿美元,同比增长22%,超出市场此前预期的18%增速。亚马逊CEO安迪·贾西明确表示,未来12个月将持续加大AI相关资本开支,总投入预计超500亿美元,重点投向AI芯片、数据中心扩建及云AI工具研发,以应对爆发的企业级AI服务需求。

3 天前
2026年4月29日披露的谷歌云最新季度财报显示,其单季度营收首次突破200亿美元大关,核心增长动力来自企业级AI训练、推理算力服务的爆发式需求。谷歌云官方坦言,当前算力产能不足直接限制了业务增速,若产能充足该季度营收还将实现更高幅度增长。

4 天前
2026年4月29日,英伟达正式发布开放式多模态大模型Nemotron 3 Nano Omni,采用30B-A3B混合专家架构,原生集成音视觉编码器无需额外感知模型,推理效率较传统方案提升9倍,在复杂文档解析、音视频理解等领域表现优异,跻身六大权威评测榜单前列,H Company首席执行官Gautier Cloix称其为智能体技术的重要突破。

4 天前
当地时间2026年4月28日,英伟达正式推出开放式多模态大模型Nemotron3Nano Omni,该产品采用30B-A3B混合专家架构,内置视觉与音频编码器,可同步处理视频、音频、图像、文本四类内容。官方数据显示其吞吐量为同类开放式全向模型的9倍,在六大权威多模态能力排行榜中均位列第一,可大幅降低开发者部署AI应用的成本。

4 天前
近日,芯片厂商英伟达在官方驱动更新博客中低调披露新版GeForce RTX 5070 GPU,该产品针对生成式AI本地运行需求强化Tensor Core性能,较上一代同级别产品AI推理算力提升约35%,可支持7B参数大语言模型本地流畅运行,面向消费级PC用户补齐AI应用硬件短板。