词向量聚类加权TextRank的关键词抽取

夏天

首页> 中文期刊> 《现代图书情报技术》 >词向量聚类加权TextRank的关键词抽取

词向量聚类加权TextRank的关键词抽取

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

【目的】将维基百科蕴涵的世界知识以词向量方式融入TextRank模型,改进单文档关键词抽取效果。【方法】利用Word2Vec模型基于维基百科中文数据,生成词向量模型,对TextRank词图节点的词向量进行聚类以调整簇内节点的投票重要性,结合节点的覆盖和位置因素,计算节点之间的随机跳转概率,生成转移矩阵,最终通过迭代计算获得节点的重要性得分,选取前TopN个词语生成关键词。【结果】当TopN≤7时,词向量聚类加权方法均优于对比方法;TopN=3时,F值取得最大值,比先前最优结果增量提升了3.374%;TopN＞7时,结果与位置加权法相似。【局限】聚类分析使得计算开销变高。【结论】词向量聚类加权能够改善关键词抽取效果。

著录项

来源
《现代图书情报技术》 |2017年第2期|28-34|共7页
作者
夏天;
展开▼
作者单位

中国人民大学数据工程与知识工程教育部重点实验室;

中国人民大学信息资源管理学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
抽取; 词向量; TextRank; Word2Vec;

相似文献

中文文献
外文文献
专利

1. 基于HMM的加权Textrank单文档的关键词抽取算法 [J] . 方康 ,韩立新 . 信息技术 . 2015,第004期
2. 基于改进TextRank的铁路文献关键词抽取算法 [J] . 赵占芳 ,刘鹏鹏 ,李雪山 . 北京交通大学学报 . 2021,第002期
3. 融合语义特征的TextRank关键词抽取方法 [J] . 杨延娇 ,赵国涛 ,袁振强 . 计算机工程 . 2021,第010期
4. 融合多特征的TextRank藏文文本关键词抽取方法研究 [J] . 艾金勇 . 情报探索 . 2020,第007期
5. 基于TextRank的产品评论关键词抽取方法研究 [J] . 尤苡名 . 软件导刊 . 2020,第004期
6. Tag-TextRank：一种基于Tag的网页关键词抽取方法 [C] . 李鹏 ,王斌 ,石志伟 . 第六届全国信息检索学术会议 . 2010
7. 基于Word2Vec与TextRank的关键词抽取研究 [A] . 陈芬 . 2020

词向量聚类加权TextRank的关键词抽取

摘要

著录项

相似文献

相关主题

期刊订阅