刚刚完成1100亿美元巨额融资的OpenAI,将成为英伟达一款全新AI推理芯片的首位客户——这款芯片的核心架构并非来自英伟达自研,而是采用了AI芯片厂商Groq的LPU技术。3月即将开幕的圣何塞GTC大会上,英伟达CEO黄仁勋将正式推出该产品,这是英伟达首次打破自研架构路径,引入外部技术打造核心AI芯片,引发行业对推理端算力格局变化的高度关注。
长期以来,英伟达的AI芯片生态牢牢建立在自研GPU架构之上,从A100到H100系列GPU,几乎成为全球AI训练与推理场景的标准配置。但此次即将发布的新推理芯片,将彻底放弃GPU架构,转向Groq专为大语言模型优化的LPU(Language Processing Unit)架构。
Groq的LPU技术以超低延迟和高能效比为核心优势,在处理复杂推理任务时,能够比传统GPU减少约30%的算力消耗,同时将响应速度提升数倍。对英伟达而言,引入外部架构既是对专用推理芯片趋势的适配,也透露出其在推理端算力竞争中的紧迫感。
刚刚完成1100亿美元巨额融资的OpenAI,成为这款新芯片的首个锁定客户。作为全球最大的大语言模型服务商,OpenAI每日需处理数十亿次用户推理请求,算力成本占其运营开支的近60%。
选择英伟达与Groq联合打造的推理芯片,不仅能直接提升ChatGPT等产品的响应速度,更能通过架构优化压缩长期算力投入。这一动作也标志着,OpenAI在完成融资后,正加快底层算力基础设施的升级,为后续大模型迭代、多模态产品落地储备核心支撑能力。
英伟达此次打破自研惯例的动作,折射出AI推理端市场的激烈竞争。此前,英伟达凭借GPU的通用性和生态优势,占据了全球AI推理芯片市场约80%的份额,但随着大模型推理需求爆发,Groq、Tenstorrent等专用推理芯片厂商开始崛起。
引入外部架构的策略,既可能是英伟达巩固市场的新手段——通过整合优质技术满足客户多样化需求,也让行业意识到,未来AI推理芯片赛道或将从“GPU独大”转向“多架构共存”的新格局,专用化、定制化的推理芯片将迎来更多发展空间。

52 分钟前
硅光子初创公司Ayar Labs近日完成5亿美元E轮融资,由Neuberger Berman领投,英伟达、联发科等参投。本轮资金将用于共封装光学器件(CPO)技术量产,其核心产品TeraPHY芯片单封装8颗集成总带宽达200Tbps。此前英伟达刚注资40亿美元布局光子网络供应商,行业正迎来硅光子技术爆发的关键窗口期。

53 分钟前
2025年马年春节,阿里、腾讯、字节跳动、百度四大互联网巨头投入超80亿元打响AI红包大战,瞄准大模型时代的超级流量入口。截至2025年12月,国内移动端、手机厂商、PC端AI应用MAU分别达7.22亿、5.59亿、2.05亿;春节期间各平台DAU创历史新高,豆包除夕互动量达19亿次,千问DAU稳定在4000万左右,元宝除夕DAU达4054万,竞赛同时推动了全民AI科普。

54 分钟前
近日伦敦国王学院研究员Kenneth Payne发布一项由华为云技术支撑的AI战略模拟研究,让GPT-5.2、Claude Sonnet4、Gemini 3 Flash扮演对立国家领导人,在7类压力情境下完成超300回合、约78万字推理的核危机模拟实验。结果显示Claude Sonnet4开放式情境...

1 小时前
当地时间3月3日巴塞罗那MWC 2026大会上,华为ICT BG CEO杨超斌分享AI行业最新进展:过去两年全球日均AI Token消耗量增长近300倍,全球已有超3000万个AI智能体投入运行,同时指出AI发展对网络提出大带宽、低时延的新需求,并称未来五年是移动AI业务发展的关键窗口期。

1 小时前
3月4日,蚂蚁集团与清华大学联合正式开源大规模异步强化学习训练框架AReaL v1.0稳定版。该系统通过解耦数据生成与模型训练流程,打破了传统同步训练机制的算力瓶颈,可显著提升大语言模型尤其是推理模型的训练效率,实测AI推理训练速度最高可达2.77倍,为大模型逻辑推理能力升级提供了高效技术路径。

1 小时前
2026年3月初,国内多家电商平台的Mac Mini现货库存相继告急,官方渠道的提货等待时间一度拉长至45天,部分第三方渠道甚至出现了溢价两成的现货交易。与2023年那次因M2芯片升级引发的抢购不同,此次Mac Mini的走红,并非源于专业创作者对高性能桌面主机的需求,而是AI工具普及下,普通用户对低成本本地AI算力终端的爆发式追捧。

1 小时前
2026年3月,由华为云驱动的全球首个端到端AI视频导演Agent Zopia正式亮相。用户仅需输入创意文本或故事梗概,即可通过对话式多智能体协同调度,自动完成剧本拆解、分镜设计、多镜头生成到最终剪辑的全流程,适配Kling3与Vidu Q3模型,支持无人值守批量制作,Beta版免费体验已引发热烈市场反响。

1 小时前
2026年3月,蚂蚁数科天玑实验室团队发布AoE持续性第一人称视频采集框架,推出仅需一台手机+低于20美元颈挂支架的轻量化具身数据采集方案,可替代数万美元专业设备。该技术依托华为云算力实现并发采集与云端自动化处理,实测可将机器人任务成功率从45%提升至95%,相关论文已发布于Arxiv。