登录体验完整功能(收藏、点赞、评论等) — 已累计有 12424 人加入

DeepSeek联合清北发布DualPath框架:闲置网卡加速智能体推理性能

详情页推荐

2026年2月27日,DeepSeek联合北京大学、清华大学在ArXiv平台发布全新智能体推理框架DualPath。该框架针对智能体长文本推理的I/O瓶颈,通过双路径设计激活闲置网卡带宽,在660B规模生产级模型测试中实现集群存储带宽全局池化,为大模型智能体落地提供算力优化新方向。

当大模型智能体处理万字级长文本或多轮复杂对话时,制约其推理速度的往往不是GPU算力,而是存储数据的读取效率——预填充引擎满负荷运转时,解码引擎的存储网卡却常常处于闲置状态,这种资源错配正成为生产级大模型落地的隐形障碍。

针对这一痛点,DeepSeek联合清北团队提出的DualPath框架彻底重构了传统的KV-Cache加载路径。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。