首页> 中文期刊> 《电子学报》 >基于短语向量和主题加权的关键词抽取方法

基于短语向量和主题加权的关键词抽取方法

         

摘要

现有关键词抽取算法缺乏对短语的有效表示,为抽取出更能反映文本主题的关键短语,本文提出一种基于短语向量的关键词抽取方法PhraseVecRank.首先设计基于LSTM(Long Short-Term Memory)和CNN(Convolutional Neural Network)自编码器的短语向量构建模型,解决复杂短语的语义表示问题.然后,利用短语向量对每个候选短语计算主题权重,通过主题加权排序提高关键词抽取的效果.在公共数据集和学术论文数据上的实验表明,本文提出的方法能够有效提取与文本主题信息相关的关键短语,同时利用自编码器构造的短语向量可以更好地表示短语的语义信息.

著录项

  • 来源
    《电子学报》 |2021年第9期|1682-1690|共9页
  • 作者单位

    北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心 北京100081;

    北京理工大学东南信息技术研究院 福建莆田351100;

    北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心 北京100081;

    北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心 北京100081;

    北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心 北京100081;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 自动推理、机器学习;
  • 关键词

    短语向量; 自编码器; 主题加权; 关键词抽取;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号