日前,AI公司DeepSeek联合北京大学、清华大学团队在学术平台ArXiv发布最新研究成果——针对智能体的DualPath推理框架。该框架创新性利用闲置网卡资源加速智能体推理进程,一举打破长期困扰业界的PD分离瓶颈,为解决AI智能体在长文本处理等场景下的算力与数据传输成本难题提供了新方案。
在AI智能体规模化落地的进程中,算力与数据传输的成本矛盾正日益凸显。业界流传着一句戏谑却写实的话:“计算是免费的,但移动数据是昂贵的”——当前大量AI智能体采用Policy(策略)与Decision(决策)分离的架构,在处理长文本理解、多任务协同等复杂任务时,跨模块的海量数据交互需要消耗高额网络资源,即便核心算力尚有闲置,也会因PD分离瓶颈拖慢整体推理效率,成为制约智能体性能升级的关键卡点。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录