腾讯于近期正式开源面向AI Agent的专属内存方案TencentDB Agent Memory,该项目采用MIT开源协议,基于OpenClaw与Hermes框架打造,创新性推出四层本地内存流水线架构,可大幅降低AI Agent的记忆调用延迟、提升长上下文处理稳定性,为AI Agent的落地应用提供了新的底层基础设施选项。
随着Agentic AI赛道进入落地关键期,记忆模块的性能短板正在成为制约AI Agent体验的核心瓶颈。当前行业内的主流方案要么依赖大模型原生上下文窗口,长对话场景下token成本直线上升;要么外接云端向量数据库,跨网调用延迟普遍超过100ms,难以满足实时交互需求;而自研本地记忆体系又需要投入大量研发资源做链路优化,中小团队往往无力承担。
此次开源的TencentDB Agent Memory,恰好瞄准了上述行业痛点。其核心的四层本地内存流水线架构,对不同生命周期的记忆数据做了分层处理:顶层为即时记忆缓存,存储最近10轮交互数据,调用延迟低至0.8ms;第二层为短期记忆池,适配小时级别的记忆检索需求,采用高吞吐内存结构兼顾速度与容量;第三层为长期记忆库,支持结构化语义检索,准确率较通用向量库提升12%;最底层为冷数据归档层,可将超过30天的非高频记忆转存为低成本存储介质,整体存储成本下降60%。
该项目采用MIT开源协议,对商业使用完全友好,同时原生适配OpenClaw、Hermes两大主流AI Agent开发框架,开发者仅需改动不到30行代码即可完成接入,无需重构现有业务逻辑。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 天前
2024年下半年以来,全球AI赛道迎来新一轮产品迭代潮:OpenAI下一代大模型GPT-5研发进入收尾阶段,Google Gemini全端覆盖用户突破10亿,苹果Apple Intelligence随新系统正式推送,国内厂商DeepSeek、Perplexity等垂直类AI工具月活涨幅超60%,AI代理、AI PC等新形态应用也从概念走向落地,全行业商业化进程持续提速。

1 天前
2026年5月21日,全球头部流媒体音频服务商Spotify在年度投资者日上,正式推出其AI战略核心载体Studio by Spotify Labs桌面应用。这款搭载全功能AI Agent的生成式音频产品,可打通用户日程、邮箱等多端数据生成个性化音频内容,标志着Spotify从传统音频播放器向生成式音频平台转型,目前该产品研发预览版已在20余个地区开放测试。

1 天前
2026年5月,潮流电商平台得物公开其基于AI Coding工具Claude Code的数仓开发落地实践,团队在将重复性开发工作效率提升超40%的过程中,也定位到长对话上下文遗忘、规则执行稳定性不足两大核心痛点,实测数据显示AI生成SQL的数据偏差最高可达1000倍,为全行业企业级AI开发工具落地提供了极具参考性的真实样本。

1 天前
近日阿里巴巴旗下大模型业务线通义千问正式推出全新推理Agent模型Qwen3.7-Max,这款产品搭载最高100万Token的长上下文窗口,在第三方权威测评Artificial Analysis Intelligence Index中拿到56.6的高分,大幅刷新了同级别推理Agent模型的性能基准,为复杂长文档处理、多步骤任务自主执行场景提供了全新的落地方案。

2 天前
全球半导体厂商AMD正式发布面向端侧AI场景的全新Ryzen AI Max 400系列处理器,最高可支持192GB统一内存容量,彻底打破过往移动端AI算力平台的内存瓶颈。该产品可直接本地运行70B甚至更大参数的开源大模型,首批适配的移动工作站产品预计2025年第二季度逐步放量,有望重构端侧AI硬件的现有竞争格局。

2 天前
国内头部大模型厂商月之暗面(Moonshot AI)在完成20亿美元新一轮融资后,正式启动VIE及红筹架构拆除工作,整体重组完成后公司将满足赴港上市的全部合规要求,冲击200亿美元的资本市场估值,这也将成为国内生成式AI赛道成立时间最短、估值跃升速度最快的准IPO企业之一。

2 天前
2026年5月21日谷歌正式宣布推出AI原生编程开发工具AI Studio的Android版本,目前该产品已在Google Play应用商店开启全区域预注册通道。这款面向零基础新手和资深开发者的智能开发工具,依托大模型驱动的智能提示能力大幅简化应用搭建流程,打破传统PC端开发的场景限制,有望进一步扩大移动端开发人群基数。

2 天前
2026年5月21日,亚马逊旗下云AI开发平台SageMaker AI正式推出支持OpenAI兼容API的实时推理端点功能,开发者仅需修改原有应用的端点URL,无需重写代码、额外完成特殊签名封装,就可通过OpenAI官方SDK、LangChain、Strands Agents等主流开发工具直接调用托管模型,大幅降低企业跨平台迁移大模型应用的成本。