首页> 中文期刊> 《北部湾大学学报》 >基于语义相关度和频繁项集挖掘的文本分类

基于语义相关度和频繁项集挖掘的文本分类

         

摘要

为丰富和更好识别文本的特征以提高分类精度,采用一种新的算法CBAFIS(classifier based ESA and frequent item sets):首先引入基于有着内容丰富、更新速度快特点的维基百科而设计的ESA算法对训练文本中特征与维基中的概念进行语义相关度计算,把相关度最高的若干概念对词袋进行特征扩展;然后以扩展后的文档为事务、文档中的概念为项,构建FP-Tree,利用FP-Growth挖掘不同类别文本的特征频繁项集;最后将频繁项集结合Naive Bayes算法构建一个文本分类器。实验表明:新的方法在进行语义扩展后的正确率、召回率在最优的情况下分别比Native Bayes和SVM算法高出2.7%和2.6%以上,具有更高的精度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号