面向微博的新词发现和情感词典构建方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着科学技术的迅猛发展，越来越多的人使用微博平台，从而产生了大量的微博，而且大部分微博都包含发表人的情感倾向。基于情感词典的微博情感分析方法是目前判断微博情感极性的一种重要方法，但因为微博自身的特点，随意、口语化且不正规，产生了许多的网络新词，减少了现有的基础情感词典对微博倾向分析的作用和意义；大量微博的产生导致手动建立情感词典费时费力且效果不佳，所以如何识别新词和自动构建情感词典成为当前微博情感分析中亟待解决的问题。针对上述问题，本文做了三方面的工作： (1)提出了基于互信息和邻接熵的新词发现算法如何快速高效的识别新词是自然语言处理中一项非常重要的任务，针对目前新词发现存在的问题，提出了一种从左至右逐字在未切词的微博语料中发现新词的方法。通过计算候选词语与右邻接字的互信息来逐步扩展候选词语，获得候选新词集；通过计算邻接熵、删除候选新词的首尾停用词和过滤旧词语等方法来筛选新词，完成新词词典的构建。实验结果表明，本文提出的新词发现方法可以有效的识别新词。 (2)提出了基于Word2Vec和句子内部关系的自动构建情感词典的方法自动构建情感词典是情感分析中一项基础且重要的任务，针对当前构建情感词典存在的问题，提出了一种自动构建情感词典的方法。第一，通过计算词语词频与词语逆文档频率的乘积的方法构建种子词集。第二，使用Word2Vec工具以维基百科作为训练数据获得词语的词向量，并计算种子词和候选情感词的相似度；再使用本文的实验语料作为训练数据再次获得词语的词向量，并计算种子词和候选情感词的相似度，并通过TwoSim方法获得候选情感词的情感极性。第三，通过单独分析包含连词的微博，获得候选情感词的情感极性。最后，将确定了词语极性的候选词集与基础情感词典合并，从而完成情感词典的构建。通过实验验证本文提出的自动构建情感词典的方法可以有效的识别情感词。 (3)提出了基于情感词典的微博情感分析方法为进一步验证新词发现方法构建的新词词典和自动构建情感词典方法构建的情感词典的效果，将新词词典和情感词典用于微博情感极性的分析中。微博通常由多个句子组成，根据句子是否包含情感词语，分别用不同的方法进行情感分析，最后将每个句子的情感极值相加，获得微博的情感极性。

著录项

作者
刘伟童;
展开▼
作者单位

山东师范大学;

展开▼
授予单位山东师范大学;
学科计算机应用技术
授予学位硕士
导师姓名刘培玉;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;神经病学与精神病学;
关键词
新词发现; 情感; 词典; 构建;

相似文献

中文文献
外文文献
专利

1. 一种面向情感分析的微博表情情感词典构建及应用 [J] . 王文远 ,王大玲 ,冯时 . 计算机与数字工程 . 2012,第011期
2. 基于平滑SO-PMI算法的微博情感词典构建方法研究 [J] . 杜锐 ,朱艳辉 ,田海龙 . 湖南工业大学学报 . 2015,第005期
3. 面向网络语言基于微博语料的新词发现方法 [J] . 雷一鸣 ,刘勇 ,霍华 . 计算机工程与设计 . 2017,第003期
4. 微博情感分析的情感词典构造及分析方法研究 [J] . 杨立月 ,王移芝 . 计算机技术与发展 . 2019,第002期
5. 面向微博热点话题发现的多标签传播聚类方法研究 [J] . 陈羽中 ,方明月 ,郭文忠 . 模式识别与人工智能 . 2015,第001期
6. 面向微博的社会情绪词典构建及情绪分析方法研究 [C] . Jiang Shengyi ,蒋盛益 ,Huang Weijian . 中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015） . 2015
7. 面向情感倾向分析的微博表情情感词典构建及应用 [A] . 王文远 . 2012

面向微博的新词发现和情感词典构建方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅