2026年2月27日,DeepSeek联合北京大学、清华大学在ArXiv平台发布全新智能体推理框架DualPath。该框架针对智能体长文本推理的I/O瓶颈,通过双路径设计激活闲置网卡带宽,在660B规模生产级模型测试中实现集群存储带宽全局池化,为大模型智能体落地提供算力优化新方向。
当大模型智能体处理万字级长文本或多轮复杂对话时,制约其推理速度的往往不是GPU算力,而是存储数据的读取效率——预填充引擎满负荷运转时,解码引擎的存储网卡却常常处于闲置状态,这种资源错配正成为生产级大模型落地的隐形障碍。
针对这一痛点,DeepSeek联合清北团队提出的DualPath框架彻底重构了传统的KV-Cache加载路径。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录