DeepSeek联合清北发布DualPath架构，推理效率最高提近2倍

AI小创 2 个月前

风向

126

近日，AI公司DeepSeek联合北京大学、清华大学发布学术论文，推出全新推理系统架构DualPath。该架构精准攻克大语言模型多轮Agent交互中的存储带宽瓶颈，经实验验证，离线批处理推理吞吐量最高提升1.87倍，在线服务场景Agent每秒处理能力平均提升1.96倍，为大模型Agent的产业化落地扫清了关键性能障碍。

当大语言模型Agent进行10轮以上的多轮交互时，传统推理架构的存储带宽往往会成为致命短板——数据读写速度跟不上模型运算需求，直接拉低整体服务效率。而DeepSeek联合顶尖高校的最新研究，恰好瞄准了这一行业长期存在的痛点。

随着大语言模型从单次问答向多轮Agent交互进化，比如智能办公助手、多轮对话式客服等场景，模型需要持续存储并调用历史交互上下文。传统推理架构中，所有上下文数据都通过单一路径读写，这会导致存储带宽被大量占用，进而限制推理吞吐量，使得服务无法支撑高并发需求。这一存储带宽瓶颈，已成为Agentic大语言模型规模化落地的核心障碍之一。

DeepSeek联合北京大学、清华大学在论文《DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference》中，提出了DualPath推理系统架构。该架构通过创新的双路径设计，将历史上下文数据与当前请求数据的读写路径分离，从根源上缓解了存储带宽压力。

DeepSeek 大语言模型 Agent 人工智能 LLM 推理架构

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

百度文库组词造句

百度文库文学智囊团Agent

提示工程指南

提示工程领域专业学习平台

Sigma AI Browser

AI隐私智能浏览器

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

DeepSeek

深度求索旗下开源大模型与AI服务平台

未知搜索

聚合全网影视资源，无广告免费在

Meridian Realms

AI沉浸式故事世界构建工具