【24h】

Language Model for IR Using Collection Information

机译:使用收集信息的IR语言模型

获取原文

摘要

Information retrieval using meta data can be traced back to the early age of IR where documents are represented by the controlled vocabulary. In this paper, we explore the usage of meta-data information under the framework of language model. We present a new language model that is able to take advantage of the category information for documents to improve the retrieval accuracy. We compare the new language model with the traditional language model over the TREC4 dataset where the collection information for documents is obtained using the k-means clustering method. The new language model outperforms the traditional language model, which verifies our statement.
机译:使用元数据的信息检索可以追溯到IR的年龄,其中文档由受控的词汇表示。在本文中,我们在语言模型框架下探讨了Meta-Data信息的使用。我们提出了一种新的语言模型,可以利用文档的类别信息来提高检索准确性。我们将新的语言模型与传统语言模型一起使用TREC4数据集,其中使用K-means群集方法获得文档的收集信息。新的语言模型优于传统的语言模型,验证我们的陈述。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号