英伟达宣布将在2026年4月的GTC开发者大会上,推出整合Groq语言处理单元(LPU)技术的全新AI推理芯片,CEO黄仁勋称其为“世界从未见过”的系统。为布局这一技术,英伟达已投入200亿美元重注LPU赛道,旨在解决AI推理市场的性能瓶颈,进一步巩固其在AI芯片领域的主导地位。
当用户在大语言模型平台上等待响应的那零点几秒延迟,背后是AI推理芯片正面临的性能与成本双重考验。随着大模型商业化落地加速,企业对AI推理的效率需求呈指数级增长,全球AI芯片巨头们的新一轮技术竞赛已悄然打响。
在AI芯片市场,英伟达凭借GPU产品长期占据训练端的主导地位,但随着大模型从实验室走向产业应用,推理环节的瓶颈逐渐凸显。传统GPU更适合并行计算的训练任务,在处理大语言模型的实时推理请求时,存在能耗高、响应速度不足、单位算力成本偏高等问题。
据行业数据显示,AI推理的市场规模正以每年超50%的速度增长,成为AI产业链中最具潜力的细分赛道之一。英伟达此次砸下200亿美元押注LPU技术,正是瞄准这一市场缺口,试图用专门优化的芯片架构破解推理环节的性能与成本矛盾。
据外媒报道,英伟达计划在即将到来的GTC开发者大会上,发布整合Groq公司LPU(语言处理单元)技术的全新推理芯片。与通用GPU不同,LPU是专为大语言模型推理任务设计的专用芯片架构,能够更高效地处理自然语言生成、对话交互、实时内容生成等场景的计算需求。
英伟达CEO黄仁勋将这款新系统称为“世界从未见过”的产品,暗示其在响应速度、能耗比、并发处理能力上可能实现突破性提升。对于依赖实时AI交互的企业而言,这款芯片有望大幅降低推理成本,同时提升用户体验。
此次布局LPU,被业内视为英伟达在AI推理界的“诺曼底登陆”。此前,英伟达的核心优势集中在训练端,但随着大模型商业化进程加快,推理市场的重要性日益凸显——越来越多的企业开始将预算向推理环节倾斜,而非仅仅停留在模型训练阶段。
通过200亿美元的重注,英伟达试图将其在训练端的主导权延伸至推理端,构建从模型训练到落地部署的全链条技术壁垒。这一动作不仅是为了应对AMD、Groq等厂商在推理赛道的竞争,更是为了巩固其在全球AI芯片市场的绝对话语权。

49 分钟前
硅光子初创公司Ayar Labs近日完成5亿美元E轮融资,由Neuberger Berman领投,英伟达、联发科等参投。本轮资金将用于共封装光学器件(CPO)技术量产,其核心产品TeraPHY芯片单封装8颗集成总带宽达200Tbps。此前英伟达刚注资40亿美元布局光子网络供应商,行业正迎来硅光子技术爆发的关键窗口期。

50 分钟前
2025年马年春节,阿里、腾讯、字节跳动、百度四大互联网巨头投入超80亿元打响AI红包大战,瞄准大模型时代的超级流量入口。截至2025年12月,国内移动端、手机厂商、PC端AI应用MAU分别达7.22亿、5.59亿、2.05亿;春节期间各平台DAU创历史新高,豆包除夕互动量达19亿次,千问DAU稳定在4000万左右,元宝除夕DAU达4054万,竞赛同时推动了全民AI科普。

51 分钟前
近日伦敦国王学院研究员Kenneth Payne发布一项由华为云技术支撑的AI战略模拟研究,让GPT-5.2、Claude Sonnet4、Gemini 3 Flash扮演对立国家领导人,在7类压力情境下完成超300回合、约78万字推理的核危机模拟实验。结果显示Claude Sonnet4开放式情境...

1 小时前
当地时间3月3日巴塞罗那MWC 2026大会上,华为ICT BG CEO杨超斌分享AI行业最新进展:过去两年全球日均AI Token消耗量增长近300倍,全球已有超3000万个AI智能体投入运行,同时指出AI发展对网络提出大带宽、低时延的新需求,并称未来五年是移动AI业务发展的关键窗口期。

1 小时前
3月4日,蚂蚁集团与清华大学联合正式开源大规模异步强化学习训练框架AReaL v1.0稳定版。该系统通过解耦数据生成与模型训练流程,打破了传统同步训练机制的算力瓶颈,可显著提升大语言模型尤其是推理模型的训练效率,实测AI推理训练速度最高可达2.77倍,为大模型逻辑推理能力升级提供了高效技术路径。

1 小时前
2026年3月初,国内多家电商平台的Mac Mini现货库存相继告急,官方渠道的提货等待时间一度拉长至45天,部分第三方渠道甚至出现了溢价两成的现货交易。与2023年那次因M2芯片升级引发的抢购不同,此次Mac Mini的走红,并非源于专业创作者对高性能桌面主机的需求,而是AI工具普及下,普通用户对低成本本地AI算力终端的爆发式追捧。

1 小时前
2026年3月,由华为云驱动的全球首个端到端AI视频导演Agent Zopia正式亮相。用户仅需输入创意文本或故事梗概,即可通过对话式多智能体协同调度,自动完成剧本拆解、分镜设计、多镜头生成到最终剪辑的全流程,适配Kling3与Vidu Q3模型,支持无人值守批量制作,Beta版免费体验已引发热烈市场反响。

1 小时前
2026年3月,蚂蚁数科天玑实验室团队发布AoE持续性第一人称视频采集框架,推出仅需一台手机+低于20美元颈挂支架的轻量化具身数据采集方案,可替代数万美元专业设备。该技术依托华为云算力实现并发采集与云端自动化处理,实测可将机器人任务成功率从45%提升至95%,相关论文已发布于Arxiv。