登录体验完整功能(收藏、点赞、评论等) — 已累计有 10147 人加入
智能AI助手

您好,我是AI助手

我可以帮您推荐合适的AI工具,有什么需要帮忙的吗?

我会根据您的需求,智能推荐站内收录的AI工具
猜您想问
推荐一些AI写作工具 有什么AI绘画工具? 推荐视频剪辑AI工具
AI助手: 我可以帮您推荐合适的AI工具,有什么需要帮忙的吗?

ZeroEntropy推出Zerank-2重排器 重构高精度检索重排技术管线

详情页推荐

AI基础设施厂商ZeroEntropy于近期正式推出新一代重排器产品Zerank-2,面向检索增强生成(RAG)、企业知识库问答、语义搜索等场景,可实现检索重排管线精度最高提升47%,同时将推理延迟降低32%,为大模型落地高频查询场景提供了更高性价比的技术方案,目前该模型权重已面向开发者开源开放。

随着大模型产业进入落地深水区,检索增强生成(RAG)已经成为企业降低大模型幻觉、适配私有数据场景的首选方案,但不少企业都遇到了相似的落地难题:粗排召回的内容冗余度高,重排环节要么精度不足漏过有效信息,要么参数太大推理速度跟不上高并发需求,重排环节的性能短板直接拉低了整个大模型应用的用户体验。

据行业调研数据显示,2026年国内企业级大模型的落地渗透率已经突破60%,其中72%的落地场景采用了RAG架构。但在实际部署中,有近6成企业反馈其RAG系统的查询结果准确率达不到业务要求,其中80%的问题都出在重排环节:传统的小参数重排器语义匹配能力不足,无法准确识别查询和候选文本的隐性关联,而大参数重排器单条查询的推理成本是小参数模型的5倍以上,很难支撑C端或高频内部查询场景的需求。

不同于行业内单纯靠堆叠参数提升重排精度的思路,ZeroEntropy的Zerank-2研发团队针对重排环节的语义匹配逻辑做了专项优化,新增了细粒度实体识别、上下文关联度打分等模块,哪怕是查询内容和候选文本的表述差异较大,也能准确识别二者的关联度,大幅降低了漏排、错排的概率。

公开测试数据显示,Zerank-2在MTEB语义检索权威榜单上的平均精度得分,超过此前主流同参数重排器21个百分点,同时团队对推理框架做了极致裁剪优化,单卡每秒可处理超过1200条查询配对,比同精度级别的产品推理速度快3倍以上。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。