首页> 中文学位 >基于半监督学习的维吾尔语情感分析研究
【6h】

基于半监督学习的维吾尔语情感分析研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1 课题来源

1.2 课题背景及意义

1.3 国内外研究现状

1.4 存在的问题

1.5 本论文主要工作

1.6 本论文的组织结构

第2章 相关知识介绍

2.1 维吾尔语语料

2.2 基于监督学习的分类算法

2.3 基于无监督学习的算法

2.4 主动学习算法

2.5 Word2vec和Sentence2vec

2.6 Weka

2.7 本章小节

第3章 基于主动学习的SVM分类方法

3.1 算法框架

3.2 维吾尔语语料预处理

3.2 主动学习策略

3.3 实验结果与分析

3.4 本章小结

第4章 基于层次聚类的无监督学习方法

4.1 算法框架

4.2 层次的k-means聚类

4.4 实验结果与分析

4.5 本章小结

第5章 半监督学习

5.1 不平衡语料

5.2 半监督学习

5.3 不平衡语料中的半监督学习

5.4 实验结果与分析

5.5 本章小结

第6章 总结与展望

6.1 研究工作总结

6.2 展望

参考文献

在读硕士研究生期间发表论文

致谢

声明

展开▼

摘要

随着互联网技术的不断普及,使得我们的生活与之息息相关。在微博等实时性交流工具的广泛应用下,互联网上的自由言论呈爆炸性的增长。如果这些言论中的负面信息大范围传播,将会对社会有很大的影响。为了解决这一问题,情感分析的研究可以避免这些不必要的现象发生。
  大语种的情感分析研究相对来说比较多,但是一些少数民族语言的情感分析研究还很少。就目前的维吾尔语情感分析来说存在以下几个难点:一、维吾尔语语料库的不平衡性导致标注语料在分类器中的效果不佳,需要加强情感语料的平衡性;二、基于机器学习的维吾尔语情感分析还不是很成熟,有许多未知的问题有待于发掘。本文针对维吾尔语情感分析的研究,开展了以下几个方面的研究:
  首先,本文使用主动学习策略筛选需要标注的语料构建SVM分类器,这些策略包括分类不确定性、聚类代表性和样本差异性。其次使用层次k-means聚类对余下大量未标注语料进行无监督学习,其结果可以作为半监督学习的辅助语料。最后,针对语料的正负数量不平衡导致分类器性能严重降低的问题,本文结合有监督学习和无监督学习,提出了半监督学习的方法,较好的解决了不平衡语料下的维吾尔语情感分类。
  实验表明,加入主动学习策略的SVM分类器通过训练较少语料就能获得不错的分类效果。同时平衡语料下的半监督学习相对于传统有监督学习具有更好的效果。它既能减少人工标注的工作量,也提高了情感分类的准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号