首页> 中文学位 >基于主题情感联合概率模型的虚假评论检测研究
【6h】

基于主题情感联合概率模型的虚假评论检测研究

代理获取

目录

第一个书签之前

摘要

Abstract

Contents

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 虚假评论识别的研究现状

1.2.2 主题模型的研究现状

1.3 研究内容

1.4 论文的结构安排

2 相关理论基础

2.1 文本特征

2.1.1 n-gram语言特征

2.1.2 融合心理学和计算机语言特征

2.1.3 句法特征

2.2 特征选择

2.2.1 TF-IDF

2.2.2 卡方检验

2.3 主题模型

2.3.1 LDA主题模型

2.3.2 sLDA主题模型

2.4 分类算法

2.4.1 支持向量机

2.4.2 随机森林算法

2.5 本章小结

3 主题情感联合概率模型

3.1 融合情感的主题模型

3.1.1 JST主题模型

3.1.2 ASUM主题模型

3.2 UTSJ模型定义

3.2.1 模型思想

3.2.2 模型结构

3.3 UTSJ模型求解

3.4 本章小结

4 虚假评论检测实验及结果分析

4.1 数据集

4.2 评估标准

4.3 实验设置

4.4 实验结果分析

4.4.1 Gibbs Sampling迭代次数和主题个数的影响分析

4.4.2 模型在均衡数据和不均衡数据的实验结果

4.4.3 模型在不同领域数据上的实验结果

4.5 本章小结

5 总结与展望

5.1 论文总结

5.2 展望

参考文献

致谢

从事的科学研究和学习经历

攻读学位期间的主要成果和获奖情况

展开▼

摘要

随着智能终端设备的普及,消费者倾向于通过网上购买商品,这催生了电子商务的繁荣。由于电子商务虚拟环境普遍存在着信息不对称性,消费者无法准确获得商品质量信息,因此更多地借助历史评论衡量商品的好坏。然而,有些不法商家抓住机制的漏洞,雇佣网络水军撰写不实的言论以提高自身声誉,吸引消费者购买。评论大数据的产生使得人们很难用肉眼辨别出哪些是虚假评论。传统的虚假评论检测模型取得了一定的研究成果。但是,由于这些模型仅使用语言特征和语法结构特征,不能很好地挖掘文本的语义和情感信息,准确率的提升受到限制。深度神经网络模型虽然能够学习到文本的抽象特征,但是结果缺乏可解释性。为了提高虚假评论检测的准确性,本文以语义和情感为视角,提出无监督的主题情感联合概率模型UTSJ(Unsupervised Topic-sentiment Joint Probabilistic Model)。论文主要完成了以下几个方面的工作:
  (1)结合主题模型方法进行虚假评论检测。从语义和情感的角度,选取传统的主题模型LDA和融合情感的主题模型JST,研究该模型在虚假评论检测领域应用的效果。在传统LDA模型的基础上,增加情感层,提出无监督的主题情感联合概率模型UTSJ。
  (2)在真实的Yelp评论的语料集上进行了大量的对比实验。首先,复原传统的虚假评论检测模型。在传统模型中选取基于文本语言特征模型(n-gram模型,character n-grams模型)和基于浅层语法特征的模型(POS模型)作为基准模型。其次,分别对两种领域数据(酒店和餐饮)构造均衡数据集和不均衡数据集,研究复原算法与本文提出的算法对虚假评论检测的性能。实验结果表明本文提出的算法在均衡数据和不均衡数据情况下的虚假评论检测的准确率都高于对比算法,且本文算法更适合真实电子商务环境下的不均衡大样本情况。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号