首页> 中文期刊> 《现代图书情报技术》 >一种基于χ~2统计的特征分类选择方法研究

一种基于χ~2统计的特征分类选择方法研究

         

摘要

【目的】针对传统χ~2统计无法保证各类别之间信息的均衡性从而影响分类效果的问题,改进χ~2统计以提高其应用效果。【方法】通过分析传统χ~2统计的特征选择过程及其局限,提出一种基于χ~2统计的特征分类选择方法,根据特征词与每一类的关联度分类别选取特征词。【结果】以SVM为分类模型,通过实验对比改进前后的方法对文本分类效果的影响,结果表明基于χ~2统计的特征分类选择方法在准确率、平均分类准确率、最低分类准确率、稳定性和系统运行时间等方面得到显著改善。【局限】特征词选取数量较少时,改进前后差异不明显。【结论】基于χ~2统计的特征分类选择方法,有效改善了分类模型的稳定性与泛化性能,使分类准确率的波动幅度减小,分类过程的效率显著提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号