文摘
英文文摘
原创性声明和使用授权书
第一章 概述
1.1 背景
1.2 信息检索的数据模型
1.2.1 布尔模型
1.2.2 向量模型
1.2.3 概率模型
1.3 WEB挖掘技术
1.3.1 Web挖掘分类
1.3.2 Web使用挖掘
1.3.3 Web结构挖掘
1.3.4 Web内容挖掘
1.4 信息检索中的查询优化问题
1.4.1信息检索系统中的查询优化过程
1.4.2 在线优化
1.4.3 离线优化
1.5 论文内容简介
第二章 基于WEB文本挖掘的查询扩展词典研究
2.1概述
2.1.1 基于WEB文本挖掘的查询扩展研究
2.1.2 自动查询扩展技术及其分类
2.1.3 全局自动查询扩展
2.1.4 局部自动查询扩展
2.1.5 基于概念网络的查询扩展
2.2 预备知识
2.3 系统模型
2.3.1 文本预处理模块
2.3.2 关联规则的挖掘
2.3.3 基于互信息进行广义关联规则的挖掘与规则过滤
2.3.4 概念网的形成
2.4 小结
第三章 基于用户存取模式的Web检索结果优化
3.1 概述
3.2 相关工作
3.3 Web站点的链接结构
3.4 用户存取模式与隐式的链接
3.5 生成隐式推荐链接
3.6 基于隐式链接的PageRank及重排序
3.7 实验结果
3.7.1 隐式链接的产生
3.7.2 检索的结果与评估
3.7.3 参数的选择
3.8 结果推广及其一般化模型
3.9 小结
第四章 基于泛化关联规则的Web检索结果优化
4.1 概述
4.2 初步知识
4.3 目前存在的问题
4.4 泛化关联规则的挖掘及其对站点检索的优化
4.4.1 日志预处理
4.4.2 站点的Taxonomy架构
4.4.3 挖掘算法
4.5 规则的修剪与总结
4.5.1 非兴趣规则过滤
4.5.2基于互信息的修剪
4.5.3规则总结
4.6 对检索的优化
4.7 实验结果
4.8 小结
第五章 结论
参考文献
致谢
作者攻读硕士学位期间发表的学术论文