基于WMF_LDA主题模型的文本相似度计算

张璐; 芦天亮; 杜彦辉

首页> 中文期刊> 《计算机应用研究》 >基于WMF_LDA主题模型的文本相似度计算

基于WMF_LDA主题模型的文本相似度计算

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:利用LDA模型进行文本相似度的计算考虑到了语义特征,但是存在词语数量多、未结合词语语义、未从文本层面挖掘和利用不同类别文本固有的领域间差异的缺点。针对以上问题,提出WMF_LDA(词语合并与过滤潜在狄利克雷分布)主题模型。将领域词和近义词进行统一化映射,并根据词性将文本进行过滤,最后再进行主题建模。实验证明,该方法使得建模时词语量大大减少,减少了建模过程的时间消耗,提高了最后的文本聚类的速度。并且与其他文本相似度方法相比,提出的方法在准确度上也有一定程度的提升。

著录项

来源
《计算机应用研究》 |2019年第10期|2916-29192951|共5页
作者
张璐; 芦天亮; 杜彦辉;
展开▼
作者单位

中国人民公安大学信息技术与网络安全学院北京100038;

中国人民公安大学网络空间安全与法治协同创新中心北京100038;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
词语语义; 词语合并; 词性筛选; 文本相似度;

相似文献

中文文献
外文文献
专利

1. 基于主题模型和文本相似度计算的专利推荐研究 [J] . 艾楚涵 ,姜迪 ,吴建德 . 信息技术 . 2020,第004期
2. 基于LDA主题模型的文本相似度计算 [J] . 王振振 ,何明 ,杜永萍 . 计算机科学 . 2013,第012期
3. 基于LDA主题模型的中医药方剂相似度计算 [J] . 朱志鹏 ,杜建强 ,刘英锋 . 计算机应用研究 . 2017,第006期
4. 基于短文本相似度计算的工序卡片相似度计算方法 [J] . 童伟 ,王淑营 . 黑龙江科技信息 . 2021,第017期
5. 基于短文本相似度计算的工序卡片相似度计算方法 [J] . 童伟 ,王淑营 . 科学技术创新 . 2021,第017期
6. 基于LDA主题模型的文本相似度计算 [C] . WANG Zhen-zhen ,王振振 ,HE Ming . 第四届全国智能信息处理学术会议 . 2013
7. 基于BTM主题模型特征扩展的短文本相似度计算 [A] . 张芸 . 2014

基于WMF_LDA主题模型的文本相似度计算

摘要

著录项

相似文献

相关主题

期刊订阅