首页> 中文期刊> 《计算机应用与软件》 >一种基于信息增益和改进的PageRank的关键字提取方法

一种基于信息增益和改进的PageRank的关键字提取方法

         

摘要

传统的关键字提取方法一般基于TFIDF,不仅消耗的时间过多,而且效果也不理想.提出用信息增益的思想来对文中的词进行权重的计算,并在此基础上结合改进的PageRank来提取文中的关键字.实验结果表明,该种方法得到的结果明显优于传统方法得到的结果.%Traditional keyword extraction method is generally based on TFIDF, but the effect is not satisfactory and consumes too much time as well. In this paper, we present an idea of using information gain to calculate the weight of words in the text, and based on this, we extract keywords in the text in combination with the improved PageRank. Experimental results demonstrate that the outcomes achieved with this method clearly outperform those with traditional method.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号