近日惠普正式推出面向专业创作者、科研人员的全新ZBook系列移动工作站,首次搭载NVIDIA最新Blackwell架构独立GPU与独立NPU AI加速芯片,可流畅支撑本地大模型推理、工业级3D渲染等复杂算力需求,高端型号起售价突破3万元,是当前消费级移动工作站市场AI算力配置最高的产品线之一。
近两年来,专业用户对本地AI算力的需求正在呈现爆发式增长。不少从事AIGC创作、工业仿真、生命科学研究的用户既需要移动办公的灵活性,又要避免数据上传云端的安全风险,此前的移动工作站算力往往无法满足本地运行10B以上参数大模型的需求,硬件迭代已经迫在眉睫。
据行业调研机构公开数据,2024年上半年,支持本地AI运算的工作站产品出货量同比上涨127%,其中有62%的企业用户将“本地大模型运行能力”列为采购工作站的首要指标。此前戴尔、联想等厂商推出的AI工作站均采用上一代Ada Lovelace架构GPU,仅能流畅运行7B及以下参数的本地大模型,无法满足更高阶的使用需求。
此次惠普推出的全新ZBook系列,是全球首批搭载Blackwell架构GPU的移动工作站,该架构GPU的AI推理效率比上一代提升了60%,单卡即可支持本地运行70B参数的轻量化大模型。除此之外,新品还搭载了峰值算力达48TOPS的独立NPU芯片,可独立处理AI抠图、实时语音转写、小参数模型微调等轻量级AI任务,无需占用CPU和GPU资源。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
10 天前
AMD近期正式发布锐龙Pro 9000系列工作站级处理器,全系搭载最新Zen5架构与3D V-Cache堆叠缓存技术,相较上一代产品单线程性能提升16%,多线程性能提升28%,面向本地AI工作站、专业内容创作等场景优化,本地7B参数大语言模型推理速度最高提升40%,预计将率先登陆戴尔、惠普等品牌的商用工作站产品线。

25 天前
2026年4月30日,快手正式发布面向非技术用户的AI桌面智能体KroWork。该产品支持用户通过自然语言指令完成文件处理、浏览器自动化、自定义应用生成等办公需求,可将重复工作流转化为本地应用且无需额外付费,所有操作在本地沙箱环境运行、数据不上传云端,兼顾办公效率与数据隐私。

1 个月前
2026年以来,全球天文领域正大规模落地AI星系探测技术,科研团队依托GPU算力支撑,可快速从PB级星际观测数据中筛选出微弱的未知天体信号。这类新增科研算力需求,已成为继大语言模型训练、AIGC内容生产之后,全球GPU供应缺口扩大的新诱因,当前高端通用GPU交付周期已延长至14个月,高端H100芯片市场溢价率超40%。

1 个月前
近日,针对大语言模型(LLM)部署场景中普遍存在的GPU算力闲置、资源错配问题,技术从业者提出全新的负载拆分优化方案:通过将LLM推理任务拆解为提示词处理池和生成任务池两个独立调度队列,无需新增任何硬件即可将GPU利用效率提升100%,该方案被类比为AI推理的专属快慢车道,适配各类生成式AI商用场景。

1 个月前
近日开发者JeecgBoot在Mac Studio M4Max设备上完成Claude Code对接本地大模型的实测,测试采用社区魔改蒸馏的gemma-4-26b-a4b-it-claude-opus-heretic-ara模型,对比官方原版Gemma 4,生成速度实现5~6倍提升,最高可达78tok/s,该模型采用稀疏激活MoE架构,支持256K上下文,为本地AI开发提供了新的实践参考。

1 个月前
当地时间2026年3月30日,有“HBM之父”之称的韩国科学技术院电气与电子工程学院教授金正浩公开对外表态,当前以英伟达GPU为核心的AI芯片体系即将发生根本性变革,未来高带宽内存(HBM)、高带宽闪存(HBF)将成为计算核心,GPU与CPU将退居配角,这一预判也引发全球半导体行业对存算一体架构落地节奏的广泛讨论。

1 个月前
云原生算力优化服务商ScaleOps近期完成1.3亿美元C轮融资,本轮资金将主要投入基于Kubernetes架构的实时自动化算力调度技术研发,针对性解决当前AI产业高速扩张带来的GPU供给短缺、云服务成本飙升等行业痛点,为大模型训练、推理等场景提供高性价比的算力支撑方案。

2 个月前
近期海外专业科技媒体InfoWorld针对AI训练成本高企的行业痛点发布专项调研显示,企业无需采购最新款GPU硬件,仅通过在训练循环内加入「冒烟测试」流程、优化数据传输瓶颈等简单调整,最高可削减68%的云服务算力支出,同时还能降低训练环节的碳排放,为大模型落地企业提供了可快速复用的高性价比降本路径。