首页> 中文学位 >面向目标的中文微博情感分析研究
【6h】

面向目标的中文微博情感分析研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章绪 论

1.1 研究背景及意义

1.2 国内外文献综述

1.3 论文主要内容

1.4 论文的组织结构

第2章微博情感分析相关技术基础

2.1 微博文本的特点

2.2 文本预处理

2.3 特征选择

2.4 分类模型

2.5 面向目标的文本情感分析

2.6 本章小结

第3章网络情感词典构建

3.1 引言

3.2 情感词典相关介绍

3.3 情感词典扩展相关技术

3.4 基于微博语料库的情感词典扩展

3.5 实验结果及分析

3.6 本章小结

第4章 基于句法树的面向目标微博情感分析

4.1 引言

4.2 基于句法树的结构化特征

4.3 面向目标的句法树剪枝策略

4.4 实验结果及分析

4.5 本章小结

结论

参考文献

致谢

附录A 攻读硕士学位期间发表的学术论文目录

附录B 攻读学位期间所参加的科研项目目录

展开▼

摘要

Web2.0的出现改变了传统的信息传播和共享方式,导致了互联网上用户产生和发布的数据呈爆炸式增长。微博是Web2.0时代最受欢迎的网络社交平台之一,由于其具有书写简单、接入方便、实时发布、交互性强等特点,一经发布就迅速吸引了大量用户。如今,微博已经成为人们记录生活、表达观点、讨论热门话题的重要途径,每天都有大量的微博消息被发布和传播,其中包含了许多有价值的主观信息。针对微博文本的情感分析技术能够利用这些主观信息,更好地完成商业调查、舆情监控、社会学研究等工作,已经成为自然语言处理领域的一大研究热点。
  微博文本具有长度受限、写作不规范、风格随意、主题发散等特点,使得针对微博的情感分析与传统的文本情感分析相比,面临着更多的困难和挑战。本文针对微博文本的特点,重点关注情感词典的扩展和面向目标的中文微博情感分析,主要完成了以下工作:
  首先,情感词典是抽取文本中情感信息的重要工具,但是微博文本中包含有大量不能被基础情感词典识别的网络情感词。针对这个问题,本文提出了一种基于依存关系的情感词识别方法,通过对情感词相关依存关系的统计和分析,构建情感词识别模版以识别微博语料中的网络情感词,再利用基于点互信息量(Pointwise Mutual Information,PMI)的方法计算情感词的倾向性,从而构建网络情感词典。实验中采用不同的情感词典抽取特征进行微博情感分析,结果表明使用本文构建的网络情感词典取得的分类效果明显优于使用基础情感词典的分类效果,平均分类准确率提高了6%~12%,从而证明了该词典的有效性。
  其次,传统的微博情感分析一般都忽略结构化的语义信息,导致分类的准确率不高;传统方法还忽略了情感表达的具体对象,以一种目标无关的形式进行情感分析,容易造成一些错误。为此,本文将句法树作为结构化特征,使用支持向量机中的卷积树核函数来处理结构化特征,并通过建立领域本体和情感评价单元句法路径库,对句法树进行面向目标的剪枝,去掉无关评价的干扰,实现面向特定目标的微博情感分析。此外,采用复合型核函数将结构化特征与平面特征结合起来,共同用于分类。实验结果表明,本文提出的方法在两个不同评价目标的数据集上准确率分别达到86.6%和86.1%,与传统方法相比有较明显的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号