首页> 中文期刊> 《现代图书情报技术》 >融合主题词嵌入和网络结构分析的主题关键词提取方法

融合主题词嵌入和网络结构分析的主题关键词提取方法

         

摘要

【目的】构建一种更加准确的主题关键字提取模型,从词向量与主题模型相结合的角度出发解决词频较小主题相关度较高词语发现的问题。【方法】提出一种融合主题词嵌入和网络结构分析的主题关键词提取方法,利用LDA主题模型进行主题关键词的初步提取,利用Word2Vec训练词向量,利用词向量相似度传播构建关键词网络,利用网络结构分析方法对主题词进行二次提取。【结果】实验结果表明,本文所提方法使得主题关键词之间的平均相似度提高14.75%,同时,在相同主题下的关键词比较中,本文方法相比LDA模型能够更准确地发现低词频高主题相关的词。【局限】样本数量有限,分词处理过程需要过多的人工参与,未对主题关键词提取结果进行深入的量化分析。【结论】融合词嵌入和网络分析方法进行文档主题关键词提取,能够有效发现低词频高主题相关的关键词,为摘要提取、舆情分析等研究提供新思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号