近日,AI公司DeepSeek联合北京大学、清华大学发布学术论文,推出全新推理系统架构DualPath。该架构精准攻克大语言模型多轮Agent交互中的存储带宽瓶颈,经实验验证,离线批处理推理吞吐量最高提升1.87倍,在线服务场景Agent每秒处理能力平均提升1.96倍,为大模型Agent的产业化落地扫清了关键性能障碍。
当大语言模型Agent进行10轮以上的多轮交互时,传统推理架构的存储带宽往往会成为致命短板——数据读写速度跟不上模型运算需求,直接拉低整体服务效率。而DeepSeek联合顶尖高校的最新研究,恰好瞄准了这一行业长期存在的痛点。
随着大语言模型从单次问答向多轮Agent交互进化,比如智能办公助手、多轮对话式客服等场景,模型需要持续存储并调用历史交互上下文。传统推理架构中,所有上下文数据都通过单一路径读写,这会导致存储带宽被大量占用,进而限制推理吞吐量,使得服务无法支撑高并发需求。这一存储带宽瓶颈,已成为Agentic大语言模型规模化落地的核心障碍之一。
DeepSeek联合北京大学、清华大学在论文《DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference》中,提出了DualPath推理系统架构。该架构通过创新的双路径设计,将历史上下文数据与当前请求数据的读写路径分离,从根源上缓解了存储带宽压力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
2026年5月,世界一级方程式锦标赛(F1)Scuderia Ferrari HP车队与科技巨头IBM达成技术合作,将基于IBM定制化AI交互系统重构赛事粉丝服务体系。双方已披露多套落地场景,预计可覆盖全球超2亿法拉利F1核心粉丝,将观赛互动转化率提升30%以上,同时为车队周边消费、会员运营提供全链路数据支撑。

3 小时前
近日,微软宣布调整Office套件的Copilot AI助手交互逻辑,新增悬浮Copilot按钮的手动关闭选项,解决了此前用户反馈的常驻悬浮键遮挡编辑区域、误触率高等问题。作为微软面向办公场景落地的核心AI工具,Copilot目前已覆盖Office全系列办公应用,全球付费企业用户规模已突破3000万,本次功能更新将进一步优化不同使用习惯用户的体验。

6 小时前
近日,AI开源研究机构Nous Research正式发布全新大模型调控技术对比神经元归因(Contrastive Neuron Attribution,简称CNA)。该技术无需进行稀疏自动编码器(SAE)训练,也不需要修改模型权重参数,仅通过消融稀疏MLP电路即可实现对大语言模型行为的精准控制,大幅降低了大模型对齐与功能定向修改的技术门槛与算力成本。

17 小时前
2026年5月,谷歌面向全球全量用户推送搜索产品的AI功能迭代后,被曝出现罕见功能性漏洞:用户在搜索框输入英文关键词“disregard”检索时,会直接导致搜索界面加载失败、功能完全失效。该漏洞已在全球多个地区的PC端、移动端搜索场景复现,目前谷歌官方尚未作出公开回应,也未推送针对性修复补丁。

17 小时前
第三方调研机构PitchBook 2026年一季度数据显示,北美地区AI初创企业对外披露的年度经常性收入(ARR)平均注水率达47%,近6成风险投资机构(VC)对被投企业的营收虚增行为知情甚至主动提供操作指导,此类合谋造星的操作正在快速推高AI赛道估值泡沫,也为后续行业健康发展埋下不小的风险隐患。

1 天前
2024年下半年以来,全球AI赛道迎来新一轮产品迭代潮:OpenAI下一代大模型GPT-5研发进入收尾阶段,Google Gemini全端覆盖用户突破10亿,苹果Apple Intelligence随新系统正式推送,国内厂商DeepSeek、Perplexity等垂直类AI工具月活涨幅超60%,AI代理、AI PC等新形态应用也从概念走向落地,全行业商业化进程持续提速。

1 天前
近日独立AI创作者借助OpenAI GPT-4o、DeepSeek大模型等工具,成功复刻科幻名作《挽救计划》(Project Hail Mary)的全星系恒星地图,经原著爱好者联合校验,该星图对书中提及的12万颗天体坐标还原度达99.7%,误差控制在0.3%以内,远超此前所有同人衍生内容的制作精度,成为近期生成式AI落地小众创作领域的标杆案例。

1 天前
全球科技巨头Meta近期正式启动基于生成式AI改造Facebook Groups的新项目,推出对标社区平台Reddit的全新兴趣社交产品。该产品集成Meta自研Llama 3大语言模型,首批灰度测试已经覆盖超过1.2亿原有Facebook群组活跃用户,主打AI驱动的内容自动化治理与兴趣匹配功能,意图抢占近年持续升温的垂直兴趣社区赛道。