首页> 中文会议>第十四届全国人机语音通讯学术会议 >基于短语模式的维吾尔文情感分类研究

基于短语模式的维吾尔文情感分类研究

摘要

由于现有的大部分维吾尔文情感分类方法通过空格分词得到的unigram特征作为文本表示,因此无法挖掘情感表达中的深层语言现象.本文首先构建了15万条维吾尔文评论情感语料库,其次分析评论文本的语言特征,总结了情感短语词性组合规则,并基于文档频率的特征选择方法(DF)抽取了潜在的具有丰富情感倾向的情感短语.最后把这些短语按不同比例与umgram特征进行组合,采用支持向量机(SVM)分类器实现了评论语料的正负二元分类.与常用的unigram,bigram特征在本文数据集上的分类结果相比,本文提取的情感短语与unigram的组合特征取得了较高的分类MacroF1值.本文所得到的情感短语可以作为维吾尔文情感词典的扩充候选集.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号