一种基于χ~2统计的特征分类选择方法研究

谭章禄; 王兆刚; 胡翰

首页> 中文期刊> 《现代图书情报技术》 >一种基于χ~2统计的特征分类选择方法研究

一种基于χ~2统计的特征分类选择方法研究

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

【目的】针对传统χ~2统计无法保证各类别之间信息的均衡性从而影响分类效果的问题,改进χ~2统计以提高其应用效果。【方法】通过分析传统χ~2统计的特征选择过程及其局限,提出一种基于χ~2统计的特征分类选择方法,根据特征词与每一类的关联度分类别选取特征词。【结果】以SVM为分类模型,通过实验对比改进前后的方法对文本分类效果的影响,结果表明基于χ~2统计的特征分类选择方法在准确率、平均分类准确率、最低分类准确率、稳定性和系统运行时间等方面得到显著改善。【局限】特征词选取数量较少时,改进前后差异不明显。【结论】基于χ~2统计的特征分类选择方法,有效改善了分类模型的稳定性与泛化性能,使分类准确率的波动幅度减小,分类过程的效率显著提高。

著录项

来源
《现代图书情报技术》 |2019年第2期|72-78|共7页
作者
谭章禄; 王兆刚; 胡翰;
展开▼
作者单位

中国矿业大学(北京)管理学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
χ~2统计; 特征选择; 文本分类; 稳定性;

相似文献

中文文献
外文文献
专利

1. 基于X2统计的改进文本特征选择方法 [J] . 闫健卓 ,李鹏英 ,方丽英 . 计算机工程与设计 . 2016,第005期
2. 一种x2统计-遗传算法的特征提取技术研究 [J] . 李华昱 ,刘亚南 ,欧阳纯萍 . 微型电脑应用 . 2012,第002期
3. 一种改进的X2统计量方法 [J] . 程传鹏 . 中原工学院学报 . 2010,第006期
4. 基于统计组合与特征分类的基因预测算法 [J] . 童庆 ,郑浩然 ,王煦法 . 中国科学技术大学学报 . 2006,第011期
5. 基于深度迁移学习的舌象特征分类方法研究 [J] . 宋超 ,王斌 ,许家佗 . 计算机工程与科学 . 2021,第008期
6. 基于报文首部统计特征分类的加密P2P流量识别方法研究 [C] . 莫遥 ,梁铸 ,吴波 . 中国电子学会第二十四届信息论学术年会 . 2017
7. 基于特征分类能力互补性的特征选择方法 [A] . 张璐 . 2015

一种基于χ~2统计的特征分类选择方法研究

摘要

著录项

相似文献

相关主题

期刊订阅