ZeroEntropy推出Zerank-2重排器重构高精度检索重排技术管线

15 小时前

风向

AI基础设施厂商ZeroEntropy于近期正式推出新一代重排器产品Zerank-2，面向检索增强生成（RAG）、企业知识库问答、语义搜索等场景，可实现检索重排管线精度最高提升47%，同时将推理延迟降低32%，为大模型落地高频查询场景提供了更高性价比的技术方案，目前该模型权重已面向开发者开源开放。

随着大模型产业进入落地深水区，检索增强生成（RAG）已经成为企业降低大模型幻觉、适配私有数据场景的首选方案，但不少企业都遇到了相似的落地难题：粗排召回的内容冗余度高，重排环节要么精度不足漏过有效信息，要么参数太大推理速度跟不上高并发需求，重排环节的性能短板直接拉低了整个大模型应用的用户体验。

据行业调研数据显示，2026年国内企业级大模型的落地渗透率已经突破60%，其中72%的落地场景采用了RAG架构。但在实际部署中，有近6成企业反馈其RAG系统的查询结果准确率达不到业务要求，其中80%的问题都出在重排环节：传统的小参数重排器语义匹配能力不足，无法准确识别查询和候选文本的隐性关联，而大参数重排器单条查询的推理成本是小参数模型的5倍以上，很难支撑C端或高频内部查询场景的需求。

不同于行业内单纯靠堆叠参数提升重排精度的思路，ZeroEntropy的Zerank-2研发团队针对重排环节的语义匹配逻辑做了专项优化，新增了细粒度实体识别、上下文关联度打分等模块，哪怕是查询内容和候选文本的表述差异较大，也能准确识别二者的关联度，大幅降低了漏排、错排的概率。

公开测试数据显示，Zerank-2在MTEB语义检索权威榜单上的平均精度得分，超过此前主流同参数重排器21个百分点，同时团队对推理框架做了极致裁剪优化，单卡每秒可处理超过1200条查询配对，比同精度级别的产品推理速度快3倍以上。

语义搜索检索增强生成 ZeroEntropy Zerank-2 重排器

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

ZeroEntropy推出Zerank-2重排器重构高精度检索重排技术管线

最新文章

X社区 · 无限公约

AI小创 v2.0 升级公告：场景化模式与隐私切换，问答更随心

OpenAI调整ChatGPT广告策略取消20万预付门槛拥抱中小商家

谷歌将Fitbit更名Google Health 强推AI健康教练遭老用户抵制

OpenAI调整ChatGPT广告战略取消高门槛拥抱中小商家市场

Google SynthID累计调用超5000万次已接入搜索与Chrome浏览器

热门文章

3秒抓心！抖音爆款文案的5个钩子秘籍

小红书爆款笔记6个黄金法则：从标题到排版的实操指南

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

您好，我是AI助手

猜您想问

ZeroEntropy推出Zerank-2重排器 重构高精度检索重排技术管线

最新文章

X社区 · 无限公约

AI小创 v2.0 升级公告：场景化模式与隐私切换，问答更随心

OpenAI调整ChatGPT广告策略 取消20万预付门槛拥抱中小商家

谷歌将Fitbit更名Google Health 强推AI健康教练遭老用户抵制

OpenAI调整ChatGPT广告战略 取消高门槛拥抱中小商家市场

Google SynthID累计调用超5000万次 已接入搜索与Chrome浏览器

热门文章

3秒抓心！抖音爆款文案的5个钩子秘籍

小红书爆款笔记6个黄金法则：从标题到排版的实操指南

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

标签

探索分类

帮助与支持

联系我们

安装网站应用

ZeroEntropy推出Zerank-2重排器重构高精度检索重排技术管线

OpenAI调整ChatGPT广告策略取消20万预付门槛拥抱中小商家

OpenAI调整ChatGPT广告战略取消高门槛拥抱中小商家市场

Google SynthID累计调用超5000万次已接入搜索与Chrome浏览器