首页> 中文学位 >基于扩展词典和规则的中文微博情感分析
【6h】

基于扩展词典和规则的中文微博情感分析

代理获取

目录

声明

致谢

摘要

1 引言

1.1 研究背景

1.2 研究目的和意义

1.3 国内外研究现状

1.3.1 文本情感分析

1.3.2 微博文本情感分析

1.4 论文的主要研究内容

1.5 论文的组织结构

2 相关理论概述和技术介绍

2.1 微博及其文本特点的相关概述

2.1.1 微博的定义及发展

2.1.2 微博文本特点概述

2.1.3 中文微博文本情感分析的难点

2.2 文本预处理技术

2.2.1 中文分词

2.2.2 去除停用词和特殊字符

2.3 特征选择

2.3.1 常用的特征选择算法

2.3.2 各类特征选择方法的优缺点

2.3.3 微博的特征选择

2.4 本章小结

3 微博情感词典的构建

3.1 情感词典相关介绍

3.1.1 情感相关术语介绍

3.1.2 微博情感词典的组成

3.2 综合基础情感词典

3.3 微博领域情感词典的创建

3.3.1 微博领域情感词典构建的重要性

3.3.2 SO-PMI算法

3.3.3 基准词和候选词的选取改进

3.3.4 SO-PMI算法扩展

3.3.5 创建微博领域情感词典

3.4 网络情感词典和表情词典

3.4.1 网络情感词典

3.4.2 微博表情词典

3.5 本章小结

4 微博语义规则及综合情感计算

4.1 词语搭配分析规则

4.1.1 程度级别词语修饰规则

4.1.2 否定词语修饰规则

4.1.3 程度词否定词同时修饰规则

4.2 语句分析规则

4.2.1 句型分析规则

4.2.2 句间分析规则

4.3 特殊语义规则

4.3.1 末句规则

4.3.2 微博文本与表情加权规则

4.4 微博文本情感值计算过程

4.5 本章小结

5 微博情感分析实验

5.1 实验准备

5.1.1 实验数据

5.1.2 实验性能评价指标

5.1.3 实验环境

5.1.4 实验所用情感词典

5.2 实验设计与结果分析

5.3 本章小结

6.1 全文总结

6.2 未来展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

近年来社交网络得到了快速的发展,作为社交平台的一员,微博以其即时性、互动性、便捷性的特点从一众社交平台中脱颖而出。越来越多的人通过微博获取信息、分享心情、交流观点。通过对微博文本中的信息进行情感分析,可以获悉群众意见、了解用户态度、得知产品信息,这对政府的政策颁布、企业的发展定向、商家的产品改良都有着巨大的益处。微博成为了人们日渐离不开的社交工具,而微博文本情感分析研究也受到了越来越多专家学者的重视。
  微博情感分析主要是判别微博文本的情感倾向,情感倾向一般分为正向、负向、中性三种类别。微博文本与传统文本在内容格式上有较大不同,在对微博进行情感分析时,需要在传统文本情感分析的基础上,加入对微博自身特点的考虑。本文对已有基础情感词典进行分析整合,并创建网络情感词典进行补充;基于微博语料文本,创建微博领域情感词典和微博表情词典,对基础情感词典进行扩展;分析文本语义规则并设置相应权值,最后结合扩展词典和语义规则对微博文本进行情感倾向性分析。
  本文的主要研究内容如下:
  (1)微博文本情感分析建立在情感词典的基础上,本文对已有基础情感词典资源进行整理和分析,根据投票规则和优先权规则创建综合基础情感词典,统计分析用户上网习惯,选取热门输入法词库中的网络情感词创建网络新词情感词典。
  (2)创建微博领域情感词典和微博表情词典对传统情感词典进行补充。基于微博语料,采用扩展的SO-PMI算法自动创建微博领域情感词典,并对创建过程中基准词选取方法和候选词选取方法进行改进;从微博预料中根据词频选取常用微博表情,创建微博表情词典。
  (3)语义规则会影响文本的情感分析效果。从词语和语句两个方面分析语义规则,词语规则主要分析否定词修饰规则和程度词修饰规则,语句规则主要分析句问规则和句型规则。此外还分析了文本末句规则以及文本表情加权规则。
  最后,为了验证本文提出的基于扩展词典和语义规则的方法的有效性,采用COAE2014微博测评数据进行实验,实验结果表明,相对于传统的微博情感判别方法,本文提出的改进方法提高了微博文本情感分析的准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号