首页> 中文学位 >基于用户偏好分析的个性化信息检索关键技术研究
【6h】

基于用户偏好分析的个性化信息检索关键技术研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1. 1 研究背景

1. 2 研究意义

1. 3 国内外研究现状

1. 4 主要研究内容

1. 5 论文的组织结构

第二章 基于“滑鼠行为”量化的检索满意度研究

2. 1 引言

2. 2 主要研究内容

2. 3 满意度假设与量化分析思想

2. 4 “滑鼠行为”的量化方法

2. 5 语料标注系统

2. 6 实验数据

2. 7 实验结果及分析

2. 8 本章小结

第三章 基于边界检测的查询意图切分技术研究

3. 1 引言

3. 2 意图切分方法及模型适应性分析

3. 3 意图切分特征选择及构建方法

3. 4 实验语料及评价方法

3. 5 实验结果分析

3. 6 本章小结

第四章 用户社交媒体活动与信息检索关联性分析

4. 1 引言

4. 2 相关术语及定义

4. 3 研究方法及系统框架

4. 4 实验设计及结果分析

4. 5 本章小结

第五章 总结和展望

5. 1 工作总结

5. 2 工作展望

参考文献

攻读学位期间公开发表的论文

致谢

展开▼

摘要

个性化信息检索旨在根据用户不同的信息需求,结合主观价值倾向,给具有不同信息需求的用户返回符合其期望的检索结果。其核心内容在于分析不同用户的个性化特征,结合其自身价值倾向差异,建立个性化检索模型,从而更好的提升用户的检索体验。本文针对个性化信息检索中用户偏好分析任务开展了深入研究,文章的主要内容归纳为以下三个方面:
  ?基于“滑鼠行为”量化的检索满意度研究
  从用户信息检索行为特征入手,提出一种基于“滑鼠行为”能量消耗的满意度评价及量化模型。其中,“滑鼠行为”指用户在网页中的鼠标滑动轨迹以及点击等行为序列。首先,从用户端对信息检索质量评价的主观因素出发,引入“检索满意度”作为衡量信息检索质量的新特征;其次,通过计算用户“滑鼠”过程中的“能量消耗”,分析检索行为特征与用户满意度之间的关联性;最后,基于量化数据建立滑鼠的“能量消耗”对比模型,用于表征用户检索满意度的强弱。这一研究重点关注用户检索满意度的量化分析方法,为信息检索系统质量评价提供了一种新的特征。
  ?基于边界检测的查询意图切分技术研究
  通过分析用户连续查询日志,提出一种查询意图边界识别方法。用户完整查询意图中包含大量的检索习惯及个性化特征,识别查询意图发生改变或转移的临界位置,能够为从完整意图分析层面提取用户的个性化检索偏好提供有效的方法。首先,从大规模样本集中抽取并人工标注部分完整意图片段;其次,结合文本特征抽取方法构建自动化学习模型,包括分类及序列标注的方法,分别使用SVM和CRF模型;最后,通过开发及测试数据集优化学习算法,获得最优的意图切分性能。这一研究借助用户查询日志,通过自动化的意图片段切分技术,为抽取用户的个性化偏好特征提供研究基础和技术手段。
  ?用户社交媒体活动与信息检索关联性分析研究
  通过获取用户在一段时间内的网络活动内容,分析用户在不同时间段内进行信息检索与社交网络活动之间的关联性,建立基于个人文化背景及兴趣倾向的个性化检索模型,改善检索体验。首先,设计实验平台抓取用户在一段时间内的网络活动信息;其次,抽取其中社交网络内容及信息检索相关内容;最后,构建关联性分析模型,度量社交活动与检索行为之间的关联关系,以便利用社交网络信息构建个性化检索模型。这一工作侧重研究用户的文化背景及价值倾向对信息检索行为的影响,以便为利用社交网络信息构建个性化检索模型提供理论依据及研究基础。
  综上所述,本文针对个性化信息检索中用户偏好分析的任务,从三个方面开展相关工作,旨在为个性化信息检索中的用户偏好分析提供更加新颖、有效的研究思路及技术方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号