基于查询词聚类的信息检索系统排序模型

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着万维网信息的急速膨胀，人们需要在以几何速度增长的冗繁信息中寻找自己所需要的信息。搜索引擎逐渐成为人们日常生活中网络搜索的必备工具，而且用户越来越关注网络搜索引擎的搜索性能和反馈结果。为了提高信息检索系统的整体性能，研究者需要完善和研究信息检索系统的评价方法和排序模型，使得信息检索系统反馈给用户文档更为相关。
　　排序学习理论(Learning to Rank，LETOR)是结合信息检索技术和机器学习理论的一种新领域。LETOR理论目的是利用机器学习理论通过对训练集的自我学习，建立一个文档集相关度的排序模型。目前存在的几种信息检索系统排序方法都采用单一训练模型，其排序结果在几种传统的评估准则下表现出的性能还有待提高。针对这个问题，本文提出一种基于伪相关反馈扩展的查询词聚类算法，和基于查询词关键字的聚类算法相比，能够更好地解决查询词的简短性和模糊性影响聚类效果的问题。该算法可以获得更加可靠的查询词之间的潜在联系，基于这种潜在联系，本文进而提出一种新颖的基于查询词聚类的信息检索系统排序模型，并对查询词采用分而治之的训练方法，其要点是将查询词分为多个训练模型分别进行排序学习。使用该排序模型在OHSUMED公开数据集上做了四种模型的实验，结果表明，这种分而治之的信息检索排序模型显著地提高了信息检索系统的反馈性能，较基本的排序算法在Precision@K和nDCG@K的评价指标上有了近5％-10％的提高。

著录项

作者
万涛;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科模式识别与智能系统
授予学位硕士
导师姓名侯越先;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机;
关键词
信息检索; 查询词聚类; 排序模型; 用户文档;

相似文献

中文文献
外文文献
专利

1. 特征词抽取与查询扩展融合的信息检索系统模型 [J] . 黄名选 . 情报杂志 . 2011,第011期
2. 基于电子政务平台查询关键词共现多维可视化聚类分析研究 [J] . 夏立新 ,程秀峰 ,桂思思 . 情报学报 . 2012,第004期
3. XML检索中基于聚类的查询词扩展 [J] . 黄子越 ,万常选 . 电子科技大学学报 . 2009,第0z1期
4. 基于聚类分析的房地产股票风险排序模型研究 [J] . 徐迪 . 市场周刊：理论研究 . 2010,第010期
5. 基于聚类分析的房地产股票风险排序模型研究 [J] . 徐迪 . 市场周刊·理论研究 . 2010,第010期
6. 基于电子政务平台查询关键词共现多维可视化聚类分析研究 [C] . XiaLixin ,夏立新 ,Cheng Xiufeng . 2012全国情报学博士生学术论坛 . 2012
7. 面向查询理解的扩展词排序模型研究与应用 [A] . 徐博 . 2018

基于查询词聚类的信息检索系统排序模型

目录

摘要

著录项

相似文献

相关主题

期刊订阅