2026年巴塞罗那世界移动通信大会(MWC26)上,高通正式展出AI200机架式AI推理解决方案实物,该产品搭载56块自研AI200加速卡,总内存容量达43TB,搭配AMD EPYC霄龙处理器作为算力底座,预计2026年下半年正式商用,同时高通透露将于2028年推出自研数据中心CPU。
在2026年巴塞罗那世界移动通信大会的展台上,高通并未通过演示视频或效果图展示AI200机架,而是直接摆出了完整的实体机型,现场工作人员介绍,这款产品的硬件堆叠逻辑经过专门优化,适配高密度数据中心部署需求。
这款AI200机架整体高度为51U,采用7组5U高度的模块化系统设计。每组系统中,4U空间用于部署AI200加速卡,单个1U托盘可容纳2块加速卡,单组系统即可搭载8块加速卡,7组整机共配备56块AI200加速卡,总内存容量达到43TB。剩余1U空间则搭载2颗AMD EPYC霄龙处理器作为整机的控制与调度核心。互联层面,机架内部采用PCIe高速总线实现组件互联,跨节点则依托800G以太网实现高带宽数据传输。
高通官方明确表示,AI200推理机架将于2026年下半年实现商业可用,主要面向企业级AI推理场景,包括大模型部署、工业智能分析、云端AI服务等领域。此外,高通在展会同期还透露了长期算力生态布局计划,将于2028年推出自研的数据中心CPU产品,逐步完善从加速卡到通用处理器的全栈算力硬件体系。
此次高通推出的AI200机架,采用了“自研AI加速卡+第三方通用CPU”的混合架构方案,既可以发挥自家AI200加速卡的专业推理算力优势,又能依托AMD EPYC处理器的成熟生态,降低企业用户的部署和适配成本。相较于全自研的封闭方案,这种开放兼容的模式更贴合当前多数数据中心的现有基础设施环境,能够快速适配不同规模的AI业务需求。
随着全球AI产业的快速发展,企业级推理算力的需求持续攀升,高通此次推出的AI200机架,或将在企业级AI推理市场占据一席之地。

3 分钟前
2026年2月,伦敦国王学院研究员Kenneth Payne发布一项AI战略模拟研究,令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大语言模型扮演核危机中的国家领导人,通过反思、预测、信号/行动三阶段认知架构,在盟友信誉、政权生存等七类压力情境下完成决策。实验累计超...

15 分钟前
近期,字节跳动旗下即梦AI推出的AI舞蹈生成功能引发行业关注,乐华娱乐CEO杜华发布的AI定制女团舞视频在社交平台引发讨论。作为字节在AI内容生成领域的重要布局,该功能目前仍处于小范围测试阶段,业内预计其将为短视频内容生产带来降本增效的新可能,也将加剧AI内容生成赛道的竞争。

16 分钟前
2026年3月4日消息,主打AI代理开发的开源项目OpenClaw上线仅两个月,便以空前速度席卷全球技术社区与中文互联网。截至3月1日,其GitHub星标数突破24.1万,创下平台历史最快增长纪录。该项目从技术论坛、小红书延伸至大众媒体快速出圈,引发AI代理赛道广泛讨论,其爆发既依托技术特性,也契合当前AI应用落地的刚需风口。

17 分钟前
2026年3月2日,美团旗下光年之外团队推出其深耕AI赛道两年多来的首款C端AI原生产品Tabbit AI浏览器,本欲打响本地生活巨头的AI工具赛道入局战。但产品上线不足24小时,翻译工具陪读蛙的开发者便在X平台指控其内置翻译功能抄袭,这场高调发布迅速演变为公关危机,引发行业对AI创新边界的热议。

19 分钟前
2025年12月,第三方调研机构QuestMobile发布国内AI原生App市场最新监测数据,豆包月活用户达2.26亿,位居行业首位,其月活量超过DeepSeek、元宝、蚂蚁阿福、千问四款竞品的月活总和,凸显出豆包在该赛道的绝对领先优势,业内预判其领先地位将进一步巩固。

22 分钟前
2026年3月4日,OpenAI正式上线GPT-5.3 Instant大语言模型,针对ChatGPT的交互体验与事实准确性完成双重升级。该模型联网场景下幻觉率降低26.8%,仅依托内部知识作答时幻觉率下降近两成,同时对话语气更平等自然,减少了以往常见的说教与免责声明表述。目前已登陆ChatGPT网页端与应用端,开发者可通过API接入,OpenAI同时预告了性能更强的GPT-5.4版本。

23 分钟前
AI巨头Anthropic近日为开发者命令行工具Claude Code上线语音交互模式,率先在Windows平台开启灰度发布,仅面向5%首批用户抢先体验,未来几周将全球开放。用户输入/voice指令即可用语音下达编程任务,大幅提升开发效率。目前Anthropic年化收入已超25亿美元,周活用户自今年1月以来翻倍,该功能或推动语音编程成为行业标配。

24 分钟前
近期全球AI大模型赛道竞争持续升级,由华为云技术支撑的MiniMax旗下M2.5模型发布一周内调用量突破3.07万亿Tokens,登顶全球榜单,2月年化经常性收入(ARR)达1.5亿美元,仅搭载10B激活参数。同时DeepSeek V4将于下周发布,稀宇科技计划上半年推出MiniMax M3系列,大摩研报称其将通过架构创新解决知识容量瓶颈。