首页> 中国专利> 基于Embedding技术的无监督关键词提取方法

基于Embedding技术的无监督关键词提取方法

摘要

本发明提供一种基于Embedding技术的无监督关键词提取方法,该方法利用图卷积词嵌入技术得到文章单词的语义兼句法词向量;利用Node2Vec技术训练单词的共现关系拓扑图,从而得到共现特征词向量;利用主题词嵌入技术,得到文章单词的主题词向量;将单词的三种特征向量拼接得到混合词向量,利用混合词向量计算单词间的余弦相似度去构造单词拓扑图,使用PageRank图迭代算法得到单词的重要性分数。该方法运用多种词嵌入技术,综合了单词间的语义、句法、共现以及主题多种关联特征,使得提取效果得到大大的提升。

著录项

  • 公开/公告号CN110851570A

    专利类型发明专利

  • 公开/公告日2020-02-28

    原文格式PDF

  • 申请/专利权人 中山大学;

    申请/专利号CN201911114365.6

  • 发明设计人 张兴宇;潘炎;印鉴;

    申请日2019-11-14

  • 分类号

  • 代理机构广州粤高专利商标代理有限公司;

  • 代理人林丽明

  • 地址 510275 广东省广州市海珠区新港西路135号

  • 入库时间 2023-12-17 06:51:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-03-24

    实质审查的生效 IPC(主分类):G06F16/33 申请日:20191114

    实质审查的生效

  • 2020-02-28

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号