2026年2月27日,DeepSeek联合北京大学、清华大学在ArXiv平台发布全新智能体推理框架DualPath。该框架针对智能体长文本推理的I/O瓶颈,通过双路径设计激活闲置网卡带宽,在660B规模生产级模型测试中实现集群存储带宽全局池化,为大模型智能体落地提供算力优化新方向。
当大模型智能体处理万字级长文本或多轮复杂对话时,制约其推理速度的往往不是GPU算力,而是存储数据的读取效率——预填充引擎满负荷运转时,解码引擎的存储网卡却常常处于闲置状态,这种资源错配正成为生产级大模型落地的隐形障碍。
针对这一痛点,DeepSeek联合清北团队提出的DualPath框架彻底重构了传统的KV-Cache加载路径。
传统智能体推理采用Storage-to-Prefill单路径模式,所有KV-Cache数据都需通过预填充引擎的存储网卡加载,不仅容易造成带宽拥堵,还让解码引擎的存储网卡(SNIC)资源被浪费。而DualPath引入了Storage-to-Decode第二条路径:直接利用解码引擎闲置的SNIC带宽读取缓存数据,再通过高速计算网络(RDMA)将数据传输至预填充引擎,实现了集群存储带宽的全局池化与动态负载均衡。
在660B规模的生产级模型实验中,DualPath框架的优势得到了充分验证。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
2026年4月,亚马逊创始人杰夫·贝索斯旗下全新神秘AI实验室Project Prometheus宣布前OpenAI联合创始人Kyle Kosic正式入职。该实验室专注于开发可理解物理世界的先进人工智能系统,旨在突破现有大模型技术边界,打造更高自主性的智能系统,标志着贝索斯在AI前沿领域的布局进入落地阶段。

4 小时前
2026年4月初,英格兰依什米安超级联赛球队联合联正式签约全球首批AI职业球员Holly与Harvey,二者因无物理实体无法参与实际赛事,定位为俱乐部内容创作与品牌运营核心。4月7日联合联官宣已出售两名AI球员,收取数额未公开的虚拟转会费,该事件在足球界与科技界引发关于体育数字化边界的广泛讨论。

4 小时前
2026年4月国际大模型API分发平台OpenRouter公布的最新榜单显示,阿里旗下千问3.6 Plus登顶全球大模型周调用量榜首,且已连续4天霸榜日榜,该模型也成为平台上线以来首个单日调用量突破1万亿Token的大模型,标志着国产大模型凭借技术迭代、高性价比优势在全球市场的竞争力进一步提升。

4 小时前
印度人工智能初创企业Rocket于近期正式发布全新智能咨询平台,该平台跳出传统AI工具聚焦代码生成的限制,整合战略规划、产品搭建、竞争情报三大核心能力,可输出对标麦肯锡等头部咨询公司的专业分析报告,而服务成本仅为传统咨询的几分之一,大幅降低了中小微企业获取专业决策支持的门槛。

6 小时前
根据全球大模型聚合平台OpenRouter2026年4月发布的监测数据,2026年3月30日至4月5日中国AI大模型周调用量达12.96万亿Token,环比增长31.48%,是美国同期调用量的4倍以上。全球大模型周调用量榜单前六均为国产模型,阿里旗下Qwen3.6系列、小米MiMo-V2-Pro分列前三,凸显中国AI应用端的规模领先优势。

7 小时前
2026年4月7日,全球存储巨头三星电子发布2026年第一季度初步业绩预告,预计营业利润达57.2万亿韩元(约合379.2亿美元),较去年同期增长8倍以上,远超分析师预期的40.6万亿韩元。此轮业绩暴涨核心动力为生成式AI基础设施建设带来的存储芯片需求激增,存储价格大幅上涨推动行业彻底走出此前的下行周期。

7 小时前
2026年4月,西班牙卫星初创公司Xoople宣布完成1.3亿美元B轮融资,本轮由Nazca Capital领投,西班牙科技发展基金CDTI等机构参投。公司专注为AI模型提供地面真值数据源,CEO Fabrizio Pirondini称其专用卫星星座采集的数据精度较现有系统提升两个数量级,目前已接入微软、Esri等企业级平台生态。

7 小时前
根据全球AI模型分发平台OpenRouter2026年4月7日发布的监测数据,中国AI大模型周调用量已连续五周超越美国,2026年3月30日至4月5日当周达12.96万亿Token,环比增长31.48%,占全球总调用量近五成。阿里巴巴Qwen系列、小米MiMo-V2-Pro等产品表现突出,中国厂商包揽全球大模型周调用量榜单前六位。