基于语义相关度和频繁项集挖掘的文本分类

肖宝; 李璞; 曲艺; 胡文君

首页> 中文期刊> 《北部湾大学学报》 >基于语义相关度和频繁项集挖掘的文本分类

基于语义相关度和频繁项集挖掘的文本分类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为丰富和更好识别文本的特征以提高分类精度,采用一种新的算法CBAFIS(classifier based ESA and frequent item sets):首先引入基于有着内容丰富、更新速度快特点的维基百科而设计的ESA算法对训练文本中特征与维基中的概念进行语义相关度计算,把相关度最高的若干概念对词袋进行特征扩展;然后以扩展后的文档为事务、文档中的概念为项,构建FP-Tree,利用FP-Growth挖掘不同类别文本的特征频繁项集;最后将频繁项集结合Naive Bayes算法构建一个文本分类器。实验表明:新的方法在进行语义扩展后的正确率、召回率在最优的情况下分别比Native Bayes和SVM算法高出2.7%和2.6%以上,具有更高的精度。

著录项

来源
《北部湾大学学报》 |2017年第5期|27-33|共7页
作者
肖宝; 李璞; 曲艺; 胡文君;
展开▼
作者单位

钦州学院电子与信息工程学院;

郑州轻工业学院软件学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
语义相关度; 频繁项集; Naive; Bayes; 文本分类;

相似文献

中文文献
外文文献
专利

1. 基于语义串抽取及主题相似度度量的维吾尔文文本分类 [J] . 吐尔地·托合提 ,维尼拉·木沙江 ,艾斯卡尔·艾木都拉 . 中文信息学报 . 2017,第004期
2. 基于语义与最大匹配度的短文本分类研究 [J] . 孙建旺 ,吕学强 ,张雷瀚 . 计算机工程与设计 . 2013,第010期
3. 一种基于语义关系图的词语语义相关度计算模型 [J] . 张仰森 ,郑佳 ,李佳媛 . 自动化学报 . 2018,第001期
4. 基于维基语义图的词语语义相关度计算研究 [J] . 刘晓亮 . 情报学报 . 2014,第011期
5. 基于中文语义词典的语义相关度方法比较研究 [J] . 裘江南 ,罗志成 ,王延章 . 情报理论与实践 . 2008,第005期
6. 基于百度百科与文本分类的网络文本语义主题抽取方法 [C] . Chen Yewang ,陈叶旺 ,Chen Chaoyang . 2012年第三届中国计算机学会服务计算学术会议 . 2012
7. 基于语义相似度的中文文本分类研究 [A] . 李晓军 . 2017

基于语义相关度和频繁项集挖掘的文本分类

摘要

著录项

相似文献

相关主题

期刊订阅