面向目标的中文微博情感分析研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

Web2.0的出现改变了传统的信息传播和共享方式，导致了互联网上用户产生和发布的数据呈爆炸式增长。微博是Web2.0时代最受欢迎的网络社交平台之一，由于其具有书写简单、接入方便、实时发布、交互性强等特点，一经发布就迅速吸引了大量用户。如今，微博已经成为人们记录生活、表达观点、讨论热门话题的重要途径，每天都有大量的微博消息被发布和传播，其中包含了许多有价值的主观信息。针对微博文本的情感分析技术能够利用这些主观信息，更好地完成商业调查、舆情监控、社会学研究等工作，已经成为自然语言处理领域的一大研究热点。
　　微博文本具有长度受限、写作不规范、风格随意、主题发散等特点，使得针对微博的情感分析与传统的文本情感分析相比，面临着更多的困难和挑战。本文针对微博文本的特点，重点关注情感词典的扩展和面向目标的中文微博情感分析，主要完成了以下工作：
　　首先，情感词典是抽取文本中情感信息的重要工具，但是微博文本中包含有大量不能被基础情感词典识别的网络情感词。针对这个问题，本文提出了一种基于依存关系的情感词识别方法，通过对情感词相关依存关系的统计和分析，构建情感词识别模版以识别微博语料中的网络情感词，再利用基于点互信息量(Pointwise Mutual Information，PMI)的方法计算情感词的倾向性，从而构建网络情感词典。实验中采用不同的情感词典抽取特征进行微博情感分析，结果表明使用本文构建的网络情感词典取得的分类效果明显优于使用基础情感词典的分类效果，平均分类准确率提高了6％~12%，从而证明了该词典的有效性。
　　其次，传统的微博情感分析一般都忽略结构化的语义信息，导致分类的准确率不高；传统方法还忽略了情感表达的具体对象，以一种目标无关的形式进行情感分析，容易造成一些错误。为此，本文将句法树作为结构化特征，使用支持向量机中的卷积树核函数来处理结构化特征，并通过建立领域本体和情感评价单元句法路径库，对句法树进行面向目标的剪枝，去掉无关评价的干扰，实现面向特定目标的微博情感分析。此外，采用复合型核函数将结构化特征与平面特征结合起来，共同用于分类。实验结果表明，本文提出的方法在两个不同评价目标的数据集上准确率分别达到86.6%和86.1%，与传统方法相比有较明显的提高。

著录项

作者
韦航;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科计算机科学与技术
授予学位硕士
导师姓名王永恒;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
中文微博; 情感分析; 依存关系分析; 树核函数; 支持向量机;

相似文献

中文文献
外文文献
专利

1. 基于多部情感词典和规则集的中文微博情感分析研究 [J] . 吴杰胜 ,陆奎 . 计算机应用与软件 . 2019,第009期
2. 基于词典的中文微博情感细粒度分析研究 [J] . 马海 ,马力 . 计算机与数字工程 . 2020,第010期
3. 中文微博情感倾向性分析研究 [J] . 张彩琴 . 太原师范学院学报（自然科学版） . 2017,第004期
4. 中文微博情感分析研究与实现 [J] . 李勇敢 ,周学广 ,孙艳 . 软件学报 . 2017,第012期
5. 基于意群划分的中文微博情感倾向分析研究 [J] . 桂斌 ,杨小平 ,朱建林 . 中文信息学报 . 2015,第003期
6. 基于分割和分类联合模型的中文微博情感分析 [C] . Bo Chen ,陈波 ,Donghong Ji . 中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015） . 2015
7. 基于多部情感词典和深度学习的中文微博情感分析研究 [A] . 吴杰胜 . 2020

面向目标的中文微博情感分析研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅