声明
摘要
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 垃圾评论内容检测
1.2.2 垃圾评论发布者检测
1.2.3 垃圾评论发布团体检测
1.3 研究内容和目标
1.4 论文结构安排
第2章 垃圾评论检测关键技术研究
2.1 垃圾评论文本分析
2.1.1 垃圾评论特征分析
2.1.2 WebQM特征提取方法
2.2 垃圾评论检测技术
2.2.1 支持向量机分类算法概述
2.2.2 朴素贝叶斯分类算法概述
2.2.3 决策树分类算法概述
2.3 PU学习算法
2.3.1 PU学习算法概述
2.3.2 PU学习算法的优缺点
2.3.3 Scikit-learn
2.4 本章小结
第3章 检测框架设计与数据预处理
3.1 垃圾评论检测框架设计
3.2 数据集构建
3.2.1 黄金标准数据集
3.2.2 亚马逊数据集
3.3 数据预处理
3.4 本章小结
第4章 黄金标准数据集垃圾评论检测
4.1 特征选择与分析
4.1.1 评论内容特征
4.1.2 评论表达特征
4.1.3 特征数据归一化
4.2 垃圾评论检测算法分析与设计
4.2.1 改进型PU学习算法
4.2.2 分类性能评价指标
4.3 检测实验
4.3.1 实验设置
4.3.2 对比实验
4.4 本章小结
第5章 亚马逊数据集垃圾评论检测
5.1 多维特征选择与分析
5.1.1 评论源特征
5.1.2 评论内容特征
5.1.3 评论表达特征
5.2 基于梯度提升的决策树垃圾评论检测
5.2.1 梯度提升决策树算法分析
5.2.2 Xgboost实现
5.3 检测实验
5.4 本章小结
6.1 总结
6.2 展望
致谢
参考文献
攻读硕士学位期间发表的论文