近期,Meta与谷歌达成数十亿美元合作大规模租用TPU训练AI模型、OpenAI拟导入英伟达基于Groq技术的AI推理芯片的消息接连曝出,摩根大通一份产能报告显示谷歌计划2027年部署600万颗以上高阶TPU。一系列重磅动态标志着全球AI算力正从GPU主导时代转向非GPU芯片崛起的新格局,算力赛道迎来关键重构拐点。
当行业还在为英伟达GPU一芯难求、价格飙涨的现状感叹时,全球AI巨头们已经悄悄调转了算力布局的船头。3月2日,两则外媒密集曝光的重磅合作,直接撕开了全球AI算力格局重构的缺口。
最先引发关注的是Meta与谷歌的超大规模合作:双方签署了数十亿美元的协议,Meta将批量租用谷歌的TPU芯片用于训练自家的大语言模型。作为谷歌专为AI深度学习打造的专用芯片,TPU在Transformer架构模型的训练场景中,相比传统GPU拥有更高的运算效率和更低的能耗成本,恰好匹配Meta在大模型迭代上的海量算力需求。
几乎同一时间,OpenAI的算力调整计划也浮出水面:该公司拟导入英伟达基于Groq技术的AI推理芯片。Groq的推理芯片以低延迟、高吞吐为核心优势,能够大幅提升大模型实时交互场景的响应速度,同时降低推理环节的算力成本,这对于面临用户规模持续增长、推理算力压力陡增的OpenAI而言,无疑是一次关键的性能补位。
过去几年,英伟达GPU凭借出色的通用性和性能,几乎垄断了全球高端AI算力市场,H100、H200等型号长期处于供不应求的状态,甚至催生了“算力黄牛”产业链。但随着大模型训练和推理的需求呈指数级增长,GPU的产能瓶颈、高成本以及场景适配局限性开始凸显。
摩根大通最新流出的产能报告进一步放大了这一趋势:谷歌计划在2027年部署600万颗以上高阶TPU。这一规模不仅能完全覆盖谷歌自身Gemini等大模型的算力需求,更意味着谷歌将正式对外开放规模化的TPU算力服务,直接挑战英伟达在AI算力市场的主导地位。事实上,除了TPU,亚马逊的Inferentia、微软的Maia等专用AI芯片也在加速落地,AI算力的技术路线正在从单一GPU向多元专用芯片扩散。
业内人士普遍认为,此次Meta、OpenAI等巨头的押注,标志着AI算力正式进入“专用化时代”。未来,随着大模型向垂直场景渗透,训练与推理的算力需求将进一步分化,针对特定场景优化的专用芯片会成为主流选择——比如用于训练的TPU、用于实时推理的Groq芯片,以及面向边缘计算的低功耗NPU等。
这种趋势不仅会改变芯片厂商的竞争格局,还将重塑整个AI算力服务市场:第三方算力服务商可能推出“GPU+TPU+专用推理芯片”的混合算力解决方案,中小AI企业也能以更低成本获取适配自身场景的算力资源。而英伟达也不会坐视市场份额被蚕食,大概率会加快在专用AI芯片领域的布局,全球AI算力赛道的多元竞争大幕正在徐徐拉开。

10 小时前
据海外科技媒体2026年3月14日报道,社交巨头Meta正考虑启动新一轮最高达20%规模的裁员计划,裁撤冗余岗位释放的预算将主要用于抵消AI基础设施采购、AI领域收购及核心人才招聘等高额支出,此前Meta已连续多个季度将AI列为核心战略优先级,相关投入占比持续攀升。

1 天前
数据基础设施初创公司Nyne由父子二人联合创立,核心业务为AI智能体(AI Agent)提供缺失的人类上下文数据支撑,近日该公司宣布完成530万美元种子轮融资,本轮融资由Wischoff Ventures与South Park Commons共同领投,资金将主要用于技术研发、团队扩张及商业化场景落地。

1 天前
2026年开年不足三个月,全球AI行业已迎来多起标志性事件。据科技媒体TechCrunch梳理,当前行业既有累计超120亿美元的大额并购案落地、独立开发者旗下AI工具月活破百万的破局案例,也出现针对AI训练数据合规的公众抗议、关乎行业风险边界的核心合同谈判,整体呈现高速发展与规则博弈并行的态势。

1 天前
近期全球企业级AI落地调研报告显示,仅13%的企业AI平台项目实现了规模化商业价值,这类成功项目均选择将多源异构数据统一部署在可扩展的开源关系型数据库Postgres之上。随着智能体(Agentic)应用进入爆发期,Postgres凭借高兼容、易扩展的特性,已成为当前及未来AI架构的事实标准数据底座。

1 天前
谷歌近期针对旗下大模型产品Gemini的命令行交互工具Gemini CLI推出全新Plan模式,该模式下工具仅可调用只读类操作工具,除自身内部计划存储文件外无任何其他文件的修改权限。该功能从底层权限层面解决了AI命令行工具自动化操作时误改用户文件的痛点,预计将大幅提升开发者使用Gemini CLI执行代码巡检、环境排查等任务的安全性。

1 天前
2026年3月,百度健康正式启动面向医生群体的专业AI智能助手内测,该产品内部代号为DoctorClaw,目前处于封闭开发后的内测阶段、临近上线。其短期功能聚焦学术文献检索与日常办公辅助,长期目标是渗透临床诊疗、医学科研、教学管理等全场景,标志着百度医疗垂直大模型应用落地进入关键阶段。

1 天前
2026年3月13日,马斯克旗下人工智能公司xAI正式发布大语言模型Grok 4.20 Beta版本。第三方机构Artificial Analysis评测显示,该模型智力跑分48分,低于GPT-5、Gemini Ultra等头部模型的57分,但在AA Omniscience测试中非幻觉率达78%,创下行业新高,主打“诚实度”的定位走出了不同于头部厂商堆料拼性能的差异化路线。

1 天前
2026年3月13日,OpenAI正式向Sora视频生成API推送基于Sora2模型的重要更新,共推出五大核心能力升级,重点覆盖角色一致性支持、最高20秒生成时长、横竖屏双输出等功能,可解决批量视频生产中常见的角色视觉漂移、片段拼接断层等问题,大幅降低广告、短剧等规模化内容制作的后期成本。