首页> 中文学位 >基于数据挖掘的手机客户网络评论的研究
【6h】

基于数据挖掘的手机客户网络评论的研究

代理获取

目录

摘要

第1章 绪论

1.1 研究的背景和意义

1.2 研究现状与分析

1.2.1 现状综述

1.2.2 现状分析

1.3 研究目标和内容

1.3.1 研究目标

1.3.2 研究内容

1.4 研究路线与关键技术

1.4.1 研究路线

1.4.2 关键技术路线

1.4.3 关键技术使用工具

第2章 数据采集和预处理

2.1 数据的选取

2.1.1 手机品牌的选择

2.1.2 网站的选择

2.2 数据的采集

2.3 数据的预处理

第3章 手机客户网络评论的特征分析

3.1 基于可视化技术的特征分析

3.1.1 基于词云的可视化分析

3.1.2 基于网络语义的可视化分析

3.2 基于LDA主题模型的特征分析

3.2.1 LDA主题模型分析原理

3.2.2 LDA主题模型分析结果

第4章 基于情感词典的手机评论情感分析

4.1 情感词典的构建

4.1.1 基础情感词典

4.1.2 拓展情感词典

4.1.3 程度词词典

4.1.4 网络用语情感词典

4.2 情感计算的算法分析

4.2.1 原理分析

4.2.2 算法设计

4.3 情感计算的结果分析

第5章 基于主题和情感的客户分类

5.1 主题情感分类的构建

5.2 主题情感分类的结果

第6章 客户细分的统计分析

6.1 细分指标体系的构建

6.2 客户细分模型分析

6.3 客户细分的结果

第7章 基于客户细分的有序多分类Logistic回归分析

7.1 有序多分类Logistic回归模型分析

7.2 有序多分类Logistic回归分析的结果

7.3 有序多分类Logistic回归分析预测模型的评价

第8章 总结与展望

8.1 主要研究工作的总结

8.2 客户营销的建议

8.3 下一步工作的展望

参考文献

附录

致谢

声明

展开▼

摘要

随着移动互联网时代的发展,越来越多的客户热衷于在网络平台中发表和分享关于购买产品的评价,从而海量的关于客户的各种属性和网络评论数据存储在了网络平台中,而企业要想提升经营效益和自身竞争力,就必须要从中挖掘出有用的商业信息。本文利用数据挖掘的方法对手机客户网络评论进行了研究,主要研究工作及相关的结论有如下四个方面:
  第一,基于Gooseeker软件的网络爬虫技术研究了华为手机官网上手机客户评论的URL抓取规则和评论数据采集规则,采集了所选取网站上约2千条评论并以XML格式存储,再用Swift、Excel软件对原始数据集进行去除噪声评论的预处理,最后得到1473条,近6万字的网络评论作为样本数据集。
  第二,基于可视化技术和LDA主题模型,利用R和ROST CM6等软件,进行了评论文本的特征分析。其中可视化分析主要从词云和网络语义两个方面进行,得到词频均较高的词以及客户对产品的优点与不足的评价等相关信息,如外观好看、商品发货很快、物流速度很快,但存在电池易发热,不耐使用、续航能力差等方面的不足。基于LDA主题模型的特征分析,得到客户关注的前8个主题为“做工、手感、耳机、设计、体验、存储、电池、包装”,通过分月份的LDA主题模型分析结果,得到客户评论的主题词随着时间的变化而改变。
  第三,采用基于情感词典的方法进行了情感值分析,利用Python语言编程,计算出每条评论的情感值。进而判断客户评论的情感倾向,并通过描述统计分析,得知有21.1%的客户的评论情感值大于正面评论的情感均值,与80/20原则一致,即20%的忠实客户往往能够给企业提供80%的利润。进一步,在LDA主题模型分析得到的评论所关注的热点属性和可视化分析的词频统计的基础上,对客户所关注的各个属性的情感倾向进行了分析,得到客户负面反馈比例最高的主题是配件(25.41%),此外,在服务和系统上的负面反馈比例也比较高,分别达到了23.44%、19.70%。
  第四,为了对客户进行高价值到低价值的区间分隔,结合所采集数据的情况,首先采用客户级别、评分等级、积极情感值、消极情感值、积极情感方差、消极情感方差这6个变量作为客户特征细分的指标,采用Two-Step聚类算法,将客户分为关键客户、主要客户、普通客户、小客户这4个类别,并得到高价值客户占比为18.3%,大致反映了Pareto定律(2-8定律)。然后,在客户细分的基础上,建立了有序多分类Logistic回归预测模型,所建模型对客户类型的预测准确度为97.62%,表明了所建立模型的预测效果较好,可以用来对新样本进行客户类型的预测。
  最后,本文基于对手机客户网络评论所做的数据挖掘分析结果,进行了研究内容的总结,再根据总结所得到的结论提出了客户营销的建议以及今后研究的展望,以期给企业、商家提供参考。

著录项

  • 作者

    冯淑慧;

  • 作者单位

    广西师范大学;

  • 授予单位 广西师范大学;
  • 学科 应用统计
  • 授予学位 硕士
  • 导师姓名 梁鑫;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    商业信息; 数据挖掘; 手机客户; 网络评论;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号