首页> 中国专利> 基于BERT的伪相关反馈模型信息检索方法及系统

基于BERT的伪相关反馈模型信息检索方法及系统

摘要

本发明提供一种基于BERT的伪相关反馈模型信息检索方法,包括在伪相关反馈的第一轮检索中,首先通过BM25模型对目标文档集合D进行评估,筛选出文档集合D′,再通过BERT模型对文档集合D′中文档再次进行评估,得到文档的BERT得分;将通过BM25检索模型和BERT模型得到的文档得分线性融合,得到伪相关文档集合D1;基于伪相关文档集合D1进行查询扩展选出候选扩展词,再通过BERT句子语义相似度优化候选扩展词,得到最终的扩展词;最终的扩展词与原始查询Q结合,生成新的查询关键词集合,以BM25模型对目标文档集合D进行第二轮检索,得到最终的检索结果。本发明支持在海量信息中去除大量无用和不相关的信息,得出更加精准的候选词,提高扩展查询及最终检索的精度。

著录项

  • 公开/公告号CN110442777B

    专利类型发明专利

  • 公开/公告日2022.11.18

    原文格式PDF

  • 申请/专利权人 华中师范大学;

    申请/专利号CN201910546934.8

  • 申请日2019.06.24

  • 分类号G06F16/9532;G06F16/332;G06F40/211;

  • 代理机构武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人严彦

  • 地址 430079 湖北省武汉市洪山区珞瑜路152号

  • 入库时间 2022-12-29 02:00:48

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号