首页> 中文学位 >社会化标注系统中基于相似用户的个性化排序方法研究
【6h】

社会化标注系统中基于相似用户的个性化排序方法研究

代理获取

目录

声明

第一章 绪论

1.1 研究背景

1.2 国内外研究现状

1.3 本文的工作

1.4 论文组织安排

第二章 相关理论与技术基础

2.1 信息检索

2.2 个性化信息检索

2.3 社会化标注

2.4 用户模型

2.5 本章小结

第三章 融合标签及用户相似网络的个性化检索方法

3.1 研究概述

3.2 传统基于标签的用户相似度计算

3.3 融合标签及用户相似网络的个性化排序方法

3.4 实验与评价

3.5 本章小结

第四章 融合主题域相似的个性化检索方法

4.1 研究概述

4.2 主题域构建

4.3 融合主题域相似的用户相似度计算

4.4 社会化标注的扩展

4.5 融合主题域相似的个性化排序方法

4.6 实验与评价

4.7 本章小结

第五章 总结与展望

5.1 本文工作总结

5.2 未来工作展望

参考文献

附录A 攻读学位期间研究成果

致谢

展开▼

摘要

随着信息技术的发展和大数据时代的来临, Web上的资源呈指数级增长,搜索引擎已成为用户从中寻找资源的重要途径。近年来由于微博、微信等自媒体的兴起, Web中的信息量进一步地急剧增加,这使得传统基于核心词匹配的搜索结果越来越不能够满足大数据时代信息检索的需求。因此对原始检索结果依据用户的兴趣偏好进行过滤,使得不同用户返回结果不尽相同的个性化信息检索技术成为当前的研究热点。随着Web 2.0时代的到来,社会化标注系统如雨后春笋般涌现,不少学者开始探索将社会化标注运用到个性化信息检索中。大量的研究表明社会化标注信息有助于改善信息检索的效果,但仍存在着一定的改善空间。  本研究主要内容包括:⑴采用结果再处理策略,主要考虑利用社会标注信息有效地构建用户兴趣模型,对原始检索结果依据用户的兴趣偏好进行个性化排序。现有的个性化排序方法中,用户之间的相似度大多是通过其共同使用过的标签集来计算。然而在真实的社会化标注系统中,一方面由于用户标注网页时使用的标签数量有限,另一方面标注网页的数量相对于Web中资源的数量来说十分有限,导致用户相似度计算并不准确。⑵提出了一种融合标签及用户相似网络的个性化排序方法。该方法首先通过标签间的共现关系构建标签相似网络,利用相似网络找出标签同义词,用于扩展用户对文档的标注信息。然后结合用户在标签和文档层面上的相似性计算用户相似度,通过用户间的相似度构建用户相似网络,在查询时依据用户相似网络扩展用户感兴趣文档的范围,以提高个性化检索的准确率。实验结果表明该方法在减小时间开销的情形下,一定程度上可以改善个性化信息检索的效果。⑶提出了一种融合主题域相似的个性化排序方法。该方法首先通过主题域的划分,将不同主题含义的网页及标签分开,通过构建的标签相似网络找出标签同义词。然后结合用户标签和主题偏好找出兴趣相近的用户,并对用户的标注信息进行扩展,从而能够更好地改善信息检索的效果。在真实数据集上的实验结果表明,该方法可以有效缓解标注稀疏性问题和标签同义词问题,有助于改善用户的搜索体验。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号