DeepSeek联合北京大学、清华大学在ArXiv平台发布最新研究论文,披露专为大模型智能体打造的DualPath推理框架。该框架创新性利用闲置网卡优化KV-Cache加载效率,直击长文本推理场景下的I/O瓶颈,打破传统PD分离架构的性能限制,确保计算资源不被存储读取拖累。
当大模型智能体处理法律文书梳理、学术文献精读等数万字级的长文本任务时,不少开发者都会遇到一个棘手的隐性瓶颈:GPU的算力利用率始终上不去,明明芯片还有富余的计算能力,却因从外部存储加载KV-Cache的速度跟不上,导致整体推理效率大打折扣。
在大模型推理的PD(预填充-解码)分离架构中,预填充阶段生成的KV-Cache(键值对缓存)会被存储在外部设备中,解码阶段则需要反复读取这些缓存数据来推进推理。传统方案采用“存储至预填充引擎”的单路径加载模式,当处理长文本时,存储读取速度远远跟不上芯片的计算需求,直接导致算力资源被闲置,智能体的推理效率大幅下滑。这一短板,也成为制约大模型智能体落地复杂长文本场景的核心障碍之一。
DeepSeek联合清北团队提出的DualPath框架,正是瞄准这一痛点的破局方案。与传统单路径模式不同,DualPath引入了“存储至解码引擎”的第二条数据传输路径,并创新性调用服务器中闲置的网卡资源承担这部分数据传输任务。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
AI生成游戏应用Aippy近期在欧美市场走红,产品采用类似TikTok的滑动信息流逻辑,用户可像刷短视频一样快速切换体验不同AI生成小游戏。截至2026年4月,该应用谷歌应用商店评分为4.7,全渠道累计下载量突破100万次,单款游戏内容最高获赞超10万次,成为2026年开年以来AI C端娱乐应用落地的代表性案例。

4 小时前
最新全球青年科技行为调研显示,18-24岁Z世代群体AI工具渗透率已达78%,人均月使用ChatGPT、Google Gemini、DeepSeek、Perplexity等产品超22次,但该群体对AI的整体好感度较2023年下滑19个百分点,背后折射出当前AI行业在体验落地、内容合规、隐私保护等层面的普遍痛点。

6 小时前
2024年第三季度,全球AI大模型赛道迎来密集产品迭代:OpenAI GPT-5进入封测、谷歌Gemini多模态能力升级、DeepSeek开源系列模型性能追平第一梯队、苹果Apple Intelligence正式推送至国行设备。据行业统计,当期全球消费级AI工具月活用户已突破12亿,AI技术向C端渗透的速度远超行业年初预期。

6 小时前
美国法律AI初创Patlytics近日完成4000万美元B轮融资,本轮由风险投资机构SignalFire领投,N47、Myriad Venture Partners及多位美国法律行业资深人士、数据公司参投。成立不到两年半的Patlytics主打专利起草AI服务,核心客户包括Meta等科技巨头,累计融资额已达约6500万美元,目标打造专利律师领域的专属AI生产力工具。

6 小时前
4月9日消息,埃隆·马斯克旗下人工智能公司xAI公布最新人事任命,SpaceX旗下Starlink高级副总裁迈克尔·尼科尔斯正式出任xAI总裁。尼科尔斯已在SpaceX任职近6年,本次任命同步伴随xAI模型训练、产品与基础设施团队重组,标志着xAI与SpaceX的业务协同进入全新阶段。

6 小时前
近日,普渡科技正式发布全球首款AI原生大型洗地机器人,瞄准当前商用清洁机器人普遍存在的AI功能噱头化、复杂场景适配性差、死角需人工补扫、极端光照下定位波动等行业痛点。该产品跳出传统机器人附加AI功能的开发逻辑,从底层架构完成AI原生设计,有望大幅提升中大型商用场景的清洁作业效率。

7 小时前
近日一款搭载OpenAI旗下ChatGPT大语言模型的智能导盲机器狗正式公开亮相,该产品可通过自然语言交互实时为视障用户反馈路况信息、解答出行疑问,测试数据显示其复杂路况识别准确率达92%以上,相较传统导盲杖和导盲犬,在环境感知、即时响应等维度具备明显优势,有望填补视障出行辅助领域的供给缺口。

7 小时前
2026年4月9日,阿里云旗下AI开发平台百炼正式上线“记忆库”功能,可赋予AI Agent跨会话长期记忆能力,破解多轮对话遗忘痛点。该功能目前限时免费开放,检索性能较常规方案提升50%,配置成本降低50%,平均响应时间下降50%,开发者可通过API调用或在Agent产品中一键部署。