2026年3月圣何塞GTC大会前夕,英伟达确认将推出基于Groq LPU(语言处理单元)架构的全新AI推理芯片,这是其首次在核心算力产品线引入外部架构。2025年英伟达斥资约200亿美元完成对Groq核心团队与技术的收购式招聘,此次芯片为该交易的首次落地成果。刚完成1100亿美元巨额融资的OpenAI将成为首个大客户,黄仁勋此番务实策略被指以极致投入产出比快速抢占赛道。
据提前曝光的行业消息,在即将开幕的2026年圣何塞GTC大会上,英伟达CEO黄仁勋将正式发布一款专为AI推理优化的全新芯片。与过往自研架构不同,这款芯片的核心设计来自Groq团队的LPU(语言处理单元)架构,这也是英伟达首次在核心AI算力产品线上大规模引入外部技术方案,同时彻底放弃了此前在GPU架构中整合LPU优化的路线。
这款芯片主打AI大模型推理场景,相较于通用GPU,LPU架构针对Transformer模型的计算逻辑做了深度优化,能够在处理文本生成、对话等任务时实现更低延迟和更高能效。而刚完成1100亿美元巨额融资的OpenAI,将成为这款芯片的首个大客户——作为当前全球最大的AI服务提供商,OpenAI的GPT系列产品需要海量高效的推理算力支撑,此次合作也被视为双方在大模型算力领域的深度绑定。
这款芯片的亮相,距离英伟达2025年斥资约200亿美元收购Groq核心团队与技术的交易仅过去一年。不同于传统的公司收购,英伟达此次采用了业内俗称的“收购式招聘”模式——仅收购Groq的核心技术团队和LPU架构专利,并未接手其整体业务。这种模式能够帮助英伟达快速获取前沿技术,避免自研的漫长周期和高额成本,如今这款推理芯片的推出,正是该笔交易的首个落地成果。
长期以来,英伟达的核心竞争力来自自研的CUDA架构和GPU产品线,但在AI推理赛道,通用GPU并非最优解。其设计兼顾了模型训练和推理两大场景,无法在推理场景下实现极致的性能和能效。此前Groq的LPU芯片已经在行业内获得认可,能够为大模型推理提供更高的性能密度和更低的能耗。此次英伟达选择直接采用成熟的LPU架构,而非从零开始自研推理芯片,被行业解读为其应对AMD、谷歌TPU等竞争对手的务实打法——通过快速落地成熟方案,将研发投入转化为市场份额,实现极致的投入产出比。
随着大模型应用的爆发,AI推理市场的规模正在快速扩张。据行业调研机构数据,2026年全球AI推理芯片市场规模将突破千亿美元,而英伟达此前的GPU份额虽高,但面临越来越多的专用推理芯片挑战。此次与Groq的合作,不仅让英伟达快速补齐了专用推理芯片的产品线,也进一步巩固了与OpenAI的战略合作关系,为双方后续的大模型迭代打下算力基础。
目前英伟达和OpenAI尚未公开回应此次芯片合作的细节,但行业普遍认为,这款芯片的推出将重塑全球AI算力市场的竞争格局。

7 秒前
2026年3月4日消息,主打AI代理开发的开源项目OpenClaw上线仅两个月,便以空前速度席卷全球技术社区与中文互联网。截至3月1日,其GitHub星标数突破24.1万,创下平台历史最快增长纪录。该项目从技术论坛、小红书延伸至大众媒体快速出圈,引发AI代理赛道广泛讨论,其爆发既依托技术特性,也契合当前AI应用落地的刚需风口。

1 分钟前
2026年3月2日,美团旗下光年之外团队推出其深耕AI赛道两年多来的首款C端AI原生产品Tabbit AI浏览器,本欲打响本地生活巨头的AI工具赛道入局战。但产品上线不足24小时,翻译工具陪读蛙的开发者便在X平台指控其内置翻译功能抄袭,这场高调发布迅速演变为公关危机,引发行业对AI创新边界的热议。

3 分钟前
2025年12月,第三方调研机构QuestMobile发布国内AI原生App市场最新监测数据,豆包月活用户达2.26亿,位居行业首位,其月活量超过DeepSeek、元宝、蚂蚁阿福、千问四款竞品的月活总和,凸显出豆包在该赛道的绝对领先优势,业内预判其领先地位将进一步巩固。

6 分钟前
2026年3月4日,OpenAI正式上线GPT-5.3 Instant大语言模型,针对ChatGPT的交互体验与事实准确性完成双重升级。该模型联网场景下幻觉率降低26.8%,仅依托内部知识作答时幻觉率下降近两成,同时对话语气更平等自然,减少了以往常见的说教与免责声明表述。目前已登陆ChatGPT网页端与应用端,开发者可通过API接入,OpenAI同时预告了性能更强的GPT-5.4版本。

7 分钟前
AI巨头Anthropic近日为开发者命令行工具Claude Code上线语音交互模式,率先在Windows平台开启灰度发布,仅面向5%首批用户抢先体验,未来几周将全球开放。用户输入/voice指令即可用语音下达编程任务,大幅提升开发效率。目前Anthropic年化收入已超25亿美元,周活用户自今年1月以来翻倍,该功能或推动语音编程成为行业标配。

8 分钟前
近期全球AI大模型赛道竞争持续升级,由华为云技术支撑的MiniMax旗下M2.5模型发布一周内调用量突破3.07万亿Tokens,登顶全球榜单,2月年化经常性收入(ARR)达1.5亿美元,仅搭载10B激活参数。同时DeepSeek V4将于下周发布,稀宇科技计划上半年推出MiniMax M3系列,大摩研报称其将通过架构创新解决知识容量瓶颈。

9 分钟前
2026年3月开学季,马云联合阿里、蚂蚁集团核心管理团队齐聚杭州云谷学校,与校方及教师探讨AI技术带来的行业与教育挑战。蔡崇信、吴泳铭等高管罕见集体到场,凸显阿里系已将AI列为核心发展赛道。马云直言AI冲击远超预期,教育需帮助孩子学会与AI共存,此次聚会预示阿里将加速AI布局以应对行业变革。

10 分钟前
近日阿里通义千问(Qwen)技术负责人林俊旸被曝非自愿离职,距其团队发布Qwen3.5小模型系列仅一天。该系列含0.8B到9B四个参数版本,支持视觉理解与推理切换,本地运行仅需7GB内存。林俊旸为阿里最年轻P10级技术专家,曾推动通义千问核心迭代;有爆料称将由Google Gemini非核心成员接任,另有核心成员离职,阿里暂未回应,此事或冲击千问系列布局。