【24h】

Title Language Model for Information Retrieval

机译:信息检索的语言模型

获取原文

摘要

In this paper, we propose a new language model, namely, a title language model, for information retrieval. Different from the traditional language model used for retrieval, we define the conditional probability P(Q|D) as the probability of using query Q as the title for document D. We adopted the statistical translation model learned from the title and document pairs in the collection to compute the probability P(Q|D). To avoid the sparse data problem, we propose two new smoothing methods. In the experiments with four different TREC document collections, the title language model for information retrieval with the new smoothing method outperforms both the traditional language model and the vector space model for IR significantly.
机译:在本文中,我们提出了一种新的语言模型,即标题语言模型,用于信息检索。与用于检索的传统语言模型不同,我们将条件概率p(q | d)定义为使用查询q作为文件D的标题的概率。我们采用了从标题和文件对中学习的统计翻译模型集合来计算概率p(q | d)。为避免稀疏数据问题,我们提出了两个新的平滑方法。在具有四种不同的TREC文档收集的实验中,具有新平滑方法的信息检索的标题语言模型优于传统的语言模型和IR的矢量空间模型显着。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号