首页> 中文学位 >微博新词发现及新词情感极性判断方法
【6h】

微博新词发现及新词情感极性判断方法

代理获取

目录

第一个书签之前

展开▼

摘要

随着互联网的发展,网络不断改变着人类的交流方式和表达方式,并产生了大量的新词。作为大数据时代最热门的社交网络媒体,微博已经成为了互联网上新词诞生和快速流传的重要平台。由于不能有效识别新词,这在很大程度上影响了中文分词、情绪分析等自然语言处理任务的准确性。因此,基于微博文本的新词发现及其情感极性判断具有十分重要的研究意义与价值。 在情绪分析研究中,词语的情感极性判断是情感分析研究工作的基础。新词凭借其简洁凝练的字符表达能力而被人们广泛使用,由于对新词的认识不足,判断新词的情感极性有一定的困难,从而影响了文本情绪分析的效果。完成上述研究工作的第一个需求就是分词,分词效果的好坏直接影响了情绪分析结果的正确率,新词又是影响分词准确性的主要因素。因而,本文以微博新词发现及新词的情感极性判断作为研究课题,具体研究内容如下: 基于改进新词合成算法的新词发现。首先,分析了已经出现的一些新词发现方法存在的问题,针对被分词工具错分成多个词的新词,结合多字点互信息、左右邻接熵等统计量和改进的新词合成算法,合并相邻的词语获得候选新词;再对新词候选集合进行低频词过滤、停用词过滤、构词规则过滤、常用词典过滤等后处理,得到新词集合。 基于改进情感倾向点互信息的新词情感极性判断。本文改进了一种结合词向量和情感倾向点互信息的新词情感判断方法。首先,将文本分词后得到的词语都转换为向量形式,再计算其他词语与新词的相似度,得到新词的若干个相似词;其次,本文结合基础情感词的情感极值改进了情感倾向点互信息,通过计算新词与相似词集合中的情感词之间的情感倾向点互信息来推断新词可能的情感极性。 本文改进的新词发现方法能够比较有效地抽取新词;改进的新词情感极性判断方法也对新词的情感极性识别能力有所提升,并且判断新词的情感极性可以改善微博语句情绪分析的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号