刚刚完成1100亿美元巨额融资的OpenAI,将成为英伟达一款全新AI推理芯片的首位客户——这款芯片的核心架构并非来自英伟达自研,而是采用了AI芯片厂商Groq的LPU技术。3月即将开幕的圣何塞GTC大会上,英伟达CEO黄仁勋将正式推出该产品,这是英伟达首次打破自研架构路径,引入外部技术打造核心AI芯片,引发行业对推理端算力格局变化的高度关注。
长期以来,英伟达的AI芯片生态牢牢建立在自研GPU架构之上,从A100到H100系列GPU,几乎成为全球AI训练与推理场景的标准配置。但此次即将发布的新推理芯片,将彻底放弃GPU架构,转向Groq专为大语言模型优化的LPU(Language Processing Unit)架构。
Groq的LPU技术以超低延迟和高能效比为核心优势,在处理复杂推理任务时,能够比传统GPU减少约30%的算力消耗,同时将响应速度提升数倍。对英伟达而言,引入外部架构既是对专用推理芯片趋势的适配,也透露出其在推理端算力竞争中的紧迫感。
刚刚完成1100亿美元巨额融资的OpenAI,成为这款新芯片的首个锁定客户。作为全球最大的大语言模型服务商,OpenAI每日需处理数十亿次用户推理请求,算力成本占其运营开支的近60%。
选择英伟达与Groq联合打造的推理芯片,不仅能直接提升ChatGPT等产品的响应速度,更能通过架构优化压缩长期算力投入。这一动作也标志着,OpenAI在完成融资后,正加快底层算力基础设施的升级,为后续大模型迭代、多模态产品落地储备核心支撑能力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
6 小时前
2026年以来,美国加州AI算力集群用电需求同比上涨42%,带动全州平均电价上浮18%。此前长期为硅谷度假胜地太浩湖供电的太平洋燃气电力公司合约将于今年年底到期,受AI用电缺口挤压,其续约报价较此前上涨37%,迫使太浩湖市政部门启动新一轮能源供应商招标,优先考虑可稳定供电的清洁能源服务商。

8 小时前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

10 小时前
AI编码初创企业Cursor于2026年5月宣布启动全球化扩张进程,未来半年将在亚太地区招聘200名技术及市场类员工,新加坡办事处由资深科技高管Simon Green负责。此前该公司已与SpaceX达成重磅合作协议,SpaceX拥有600亿美元收购Cursor的权利,若未触发收购则需支付100亿美元采购其研发成果,充足资金加持下Cursor正加速技术出海落地。

10 小时前
2026年5月15日,人工智能企业OpenAI宣布将旗下代码生成模型Codex正式集成至iOS、Android双端ChatGPT移动应用,面向全球开发者提供移动端远程编码管理能力。目前Codex周活跃用户已突破400万,本次更新打破办公场景限制,支持多开发环境实时同步,开发者可利用碎片时间处理紧急代码需求。

11 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

11 小时前
2026年5月,OpenAI正式宣布将AI编程模型Codex集成至ChatGPT的iOS及Android移动端应用。本次更新针对手机使用场景做了专属交互适配,支持开发者在通勤、线下休闲等非办公场景快速完成代码审批、逻辑调试等碎片化编程任务,标志着AI编程工具正式从桌面生产力阶段迈入全时伴随的发展新阶段。

11 小时前
2026年5月,旧金山AI初创公司depthfirst开发的AI安全分析系统,自主发现潜伏18年的NGINX高危漏洞CVE-2026-42945。该漏洞CVSS评分为9.2,属于严重级别,影响2008年以来发布的NGINX 0.6.27至1.30.0版本,波及全球近三分之一网站,攻击者可利用漏洞实现远程代码执行,目前NGINX官方已发布对应修复补丁。

11 小时前
2026年5月15日,微信官方宣布旗下小程序成长计划正式完成模型层升级,全面接入腾讯混元最新迭代的Hy3 preview大模型,依托后者升级的逻辑推理与上下文理解能力优化开发者智能化开发、运营体验。此前腾讯发布的2026年第一季度财报显示,Hy3 preview调用量持续位居大模型聚合平台OpenRouter榜首,Agent、编程等核心能力均获市场广泛认可。