全球算力巨头英伟达计划于下月举办的GTC开发者大会,发布一款整合Groq尖端技术的推理专用处理器。此前英伟达已斥资200亿美元获得Groq关键技术授权,并收编其核心管理团队,此举瞄准AI智能体爆发下算力需求从模型训练转向高效推理的市场变化,OpenAI将成为该芯片的头号买家。
近期,有海外开发者在GPT-4o平台测试多智能体协同任务时发现,当同时调用12个AI智能体执行代码调试与文档整理的组合任务,系统响应延迟较单智能体场景飙升320%——这一现象并非个例,而是AI产业算力需求正在发生根本性转向的缩影。
随着AI智能体在代码开发、客户服务、自动化办公等领域的爆发式落地,市场对算力的需求逻辑已悄然改变。此前,大模型厂商的核心算力投入集中在训练环节——一款千亿参数模型的训练可能消耗数亿美元算力,但完成训练后,支撑数百万用户实时交互的推理算力,才是长期且持续的成本支出。据行业测算,2026年全球AI推理算力需求将是训练算力的8倍以上,这一缺口正在倒逼芯片厂商调整产品策略。
英伟达此次推出的新芯片,并非传统GPU的迭代升级,而是整合了AI芯片初创公司Groq的专属技术。Groq独有的语言处理单元(LPU)架构,在AI回复生成的“解码”环节效率远超传统GPU——前者能以更低延迟完成单token的生成,这恰好击中了推理算力的核心痛点。为了拿下这一技术,英伟达不仅斥资200亿美元获得关键技术授权,还将Groq的核心管理团队收编麾下,实现“技术+人才”的深度整合,而非简单的技术许可合作。
知情人士透露,OpenAI将成为这款新推理芯片的头号买家。对于OpenAI而言,其旗下ChatGPT、GPT-4o等产品每日需处理超10亿次用户请求,同时AI智能体的规模化部署对推理延迟的要求极高,英伟达与Groq联合打造的芯片能直接降低其运营成本并提升用户体验。而对英伟达来说,绑定OpenAI这一行业标杆客户,将进一步巩固其在AI推理算力市场的统治地位,精准打击AMD、Graphcore等竞争对手。
此次英伟达与Groq的“技术联姻”,标志着AI芯片市场的竞争已从训练算力转向推理算力。未来,推理芯片将朝着低延迟、高并发、专门化的方向演进,除了英伟达,AMD已推出MI300X推理芯片,国内厂商如寒武纪、海光信息也在加码推理芯片布局。但凭借与Groq的技术整合以及OpenAI的订单背书,英伟达无疑已在这一新赛场抢占了先发优势。