DeepSeek联清北发布DualPath框架：闲置网卡破解智能体推理I/O瓶颈

1 小时前 AI快讯 1

DeepSeek联合北京大学、清华大学在ArXiv平台发布最新研究论文，披露专为大模型智能体打造的DualPath推理框架。该框架创新性利用闲置网卡优化KV-Cache加载效率，直击长文本推理场景下的I/O瓶颈，打破传统PD分离架构的性能限制，确保计算资源不被存储读取拖累。

当大模型智能体处理法律文书梳理、学术文献精读等数万字级的长文本任务时，不少开发者都会遇到一个棘手的隐性瓶颈：GPU的算力利用率始终上不去，明明芯片还有富余的计算能力，却因从外部存储加载KV-Cache的速度跟不上，导致整体推理效率大打折扣。

在大模型推理的PD（预填充-解码）分离架构中，预填充阶段生成的KV-Cache（键值对缓存）会被存储在外部设备中，解码阶段则需要反复读取这些缓存数据来推进推理。传统方案采用“存储至预填充引擎”的单路径加载模式，当处理长文本时，存储读取速度远远跟不上芯片的计算需求，直接导致算力资源被闲置，智能体的推理效率大幅下滑。这一短板，也成为制约大模型智能体落地复杂长文本场景的核心障碍之一。

DeepSeek联合清北团队提出的DualPath框架，正是瞄准这一痛点的破局方案。与传统单路径模式不同，DualPath引入了“存储至解码引擎”的第二条数据传输路径，并创新性调用服务器中闲置的网卡资源承担这部分数据传输任务。

通过分流KV-Cache的加载压力，DualPath能够大幅提升数据读取速度，让计算芯片的算力得到充分释放。其核心逻辑在于：将原本集中在单一路径的I/O流量拆分，利用闲置网卡的带宽资源，确保解码阶段的KV-Cache加载与计算过程同步推进，彻底打破存储读取拖累计算效率的恶性循环。

值得注意的是，此次DualPath框架的披露，也被视为DeepSeek即将推出的V4大模型体系的重要技术铺垫。作为专注于大模型推理优化的技术厂商，DeepSeek此前已在代码大模型、长文本处理领域积累了多项成果，而DualPath框架的出现，无疑预示着其下一代V4产品将在智能体推理性能上实现显著突破，为企业级用户提供更高效的长文本处理解决方案。

DeepSeek 人工智能大模型智能体 DualPath框架 KV-Cache

本文内容来源于公开互联网信息，并包含平台新增内容及用户发布内容，旨在进行知识整理与分享。文中所有信息与观点均仅供参考，不代表任何官方或特定立场，亦不构成任何操作或决策建议，请读者谨慎甄别，详情请见完整免责声明

所属分类

AI快讯

DeepSeek联清北发布DualPath框架：闲置网卡破解智能体推理I/O瓶颈

中国AI模型周调用量达5.16万亿Token，首超美国霸榜全球

谷歌Gemini Android升级落地：Pixel 10、三星S26可自动叫车订餐

超2亿薪酬留不住！苹果AI前高管入职Meta7月后转投OpenAI

微软Copilot Tasks上线：云端AI代办，自动化处理跨应用杂务

Jack Dorsey豪赌AI：Block裁员近半，聚焦智能金融转型

黄仁勋：智能体AI已达技术转折点，英伟达年营收跃至2160亿美元

阿里千问首款AI眼镜将亮相MWC2026，3月2日启动全渠道预约

首次证实RL可赋能3D模型推理，文本到3D生成质量获跃升

分类

最新文章

中国AI模型周调用量达5.16万亿Token，首超美国霸榜全球

谷歌Gemini Android升级落地：Pixel 10、三星S26可自动叫车订餐

超2亿薪酬留不住！苹果AI前高管入职Meta7月后转投OpenAI

微软Copilot Tasks上线：云端AI代办，自动化处理跨应用杂务

Jack Dorsey豪赌AI：Block裁员近半，聚焦智能金融转型

热门文章

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

抖音爆款内容拆解：从选题到完播，这6个维度决定视频生死

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

标签

DeepSeek联清北发布DualPath框架：闲置网卡破解智能体推理I/O瓶颈

中国AI模型周调用量达5.16万亿Token，首超美国霸榜全球

谷歌Gemini Android升级落地：Pixel 10、三星S26可自动叫车订餐

超2亿薪酬留不住！苹果AI前高管入职Meta7月后转投OpenAI

微软Copilot Tasks上线：云端AI代办，自动化处理跨应用杂务

Jack Dorsey豪赌AI：Block裁员近半，聚焦智能金融转型

黄仁勋：智能体AI已达技术转折点，英伟达年营收跃至2160亿美元

阿里千问首款AI眼镜将亮相MWC2026，3月2日启动全渠道预约

首次证实RL可赋能3D模型推理，文本到3D生成质量获跃升

分类

最新文章

中国AI模型周调用量达5.16万亿Token，首超美国霸榜全球

谷歌Gemini Android升级落地：Pixel 10、三星S26可自动叫车订餐

超2亿薪酬留不住！苹果AI前高管入职Meta7月后转投OpenAI

微软Copilot Tasks上线：云端AI代办，自动化处理跨应用杂务

Jack Dorsey豪赌AI：Block裁员近半，聚焦智能金融转型

热门文章

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

抖音爆款内容拆解：从选题到完播，这6个维度决定视频生死

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

标签

微信二维码

AI小创 · 智能助手

提示