文本分类中TF-IDF算法的一种改进方法

摘要

TF-IDF算法是文本自动分类技术中常用的权重计算算法,但它没有充分考虑到特征值在类间、类内和不完全分类3种信息分布情况,影响了查全率和查对率.针对上述3种情况,提出了改进的TF-IDF算法,通过实验证明,改进的TF-IDF算法的效果明显比传统的TF-IDF算法效果好.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号