首页> 外国专利> Software domain topics extraction system using PageRank and topic modeling

Software domain topics extraction system using PageRank and topic modeling

机译:使用PageRank和主题建模的软件领域主题提取系统

摘要

According to the embodiment of the present invention, it is possible to provide a software domain topic extraction system which adds an identifier to each document to generate a corpus, thereby extracting a more accurate domain topic. The software domain topic extraction system comprises a preprocessor for extracting a set of words, a call graph generator for generating a call graph; a page ranker; a corpus generator; and a topic modeler.
机译:根据本发明的实施例,可以提供一种软件领域主题提取系统,该系统向每个文档添加标识符以生成语料库,从而提取更准确的领域主题。该软件领域主题提取系统包括:预处理器,用于提取一组单词;呼叫图生成器,用于生成呼叫图;以及页面排名;语料生成器;和主题建模者。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号