首页> 中文学位 >Web信息检索中基于Web挖掘的查询优化研究
【6h】

Web信息检索中基于Web挖掘的查询优化研究

代理获取

目录

文摘

英文文摘

原创性声明和使用授权书

第一章 概述

1.1 背景

1.2 信息检索的数据模型

1.2.1 布尔模型

1.2.2 向量模型

1.2.3 概率模型

1.3 WEB挖掘技术

1.3.1 Web挖掘分类

1.3.2 Web使用挖掘

1.3.3 Web结构挖掘

1.3.4 Web内容挖掘

1.4 信息检索中的查询优化问题

1.4.1信息检索系统中的查询优化过程

1.4.2 在线优化

1.4.3 离线优化

1.5 论文内容简介

第二章 基于WEB文本挖掘的查询扩展词典研究

2.1概述

2.1.1 基于WEB文本挖掘的查询扩展研究

2.1.2 自动查询扩展技术及其分类

2.1.3 全局自动查询扩展

2.1.4 局部自动查询扩展

2.1.5 基于概念网络的查询扩展

2.2 预备知识

2.3 系统模型

2.3.1 文本预处理模块

2.3.2 关联规则的挖掘

2.3.3 基于互信息进行广义关联规则的挖掘与规则过滤

2.3.4 概念网的形成

2.4 小结

第三章 基于用户存取模式的Web检索结果优化

3.1 概述

3.2 相关工作

3.3 Web站点的链接结构

3.4 用户存取模式与隐式的链接

3.5 生成隐式推荐链接

3.6 基于隐式链接的PageRank及重排序

3.7 实验结果

3.7.1 隐式链接的产生

3.7.2 检索的结果与评估

3.7.3 参数的选择

3.8 结果推广及其一般化模型

3.9 小结

第四章 基于泛化关联规则的Web检索结果优化

4.1 概述

4.2 初步知识

4.3 目前存在的问题

4.4 泛化关联规则的挖掘及其对站点检索的优化

4.4.1 日志预处理

4.4.2 站点的Taxonomy架构

4.4.3 挖掘算法

4.5 规则的修剪与总结

4.5.1 非兴趣规则过滤

4.5.2基于互信息的修剪

4.5.3规则总结

4.6 对检索的优化

4.7 实验结果

4.8 小结

第五章 结论

参考文献

致谢

作者攻读硕士学位期间发表的学术论文

展开▼

摘要

信息检索是一门有关信息表示、信息存储、信息组织、信息访问的学科.目前主要采用两个方面的技术,即自动查询扩展技术在线优化与基于用户日志分析的查询结果重新排序的离线优化技术.该文也主要从这两个方面进一步来提高检索的性能,优化检索的结果.该文利用文本挖掘技术来自动构造概念词典,采用文本挖掘的方法挖掘WEB文档集中的词的关联规则.我们将文档集中的文档按照倒排文件建立索引文件,利用文本挖掘技术挖掘文档集合中的词的互现特征,获取词间相关度,并分析词间的关系,以此获得概念词典.然后近可能采用与查询词所有互现的词用来扩展.实验结果显示,基于该方法的概念词典具有动态性、时效性、准确性等特征.我们将构造的概念词典应用到查询扩展中,能明显提高检索的召回率和检索的精度.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号