基于双向LSTM语义强化的主题建模

彭敏; 杨绍雄; 朱佳晖

首页> 中文期刊> 《中文信息学报》 >基于双向LSTM语义强化的主题建模

基于双向LSTM语义强化的主题建模

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

To construct a semantic coherent topic model,this paper proposes a probabilistic topic model DGPU-LDA (Double Generalized Polya Urn with LDA)which is built on the deep semantic reinforcement from bi-directional LSTM.In order to embed the semantic information of documents,we design a document-wise semantic encoder DS-Bi-LSTM (Document Semantic Bi-directional LSTM).For the model inference,we employ such mechanisms as doc-ument-topic GPU semantic reinforcement,word-word GPU semantic reinforcement and LSTM iterative dependency modeling to capture the Gibbs sampling process.Finally,we implement our method and other baselines on SogouCA and 20 Newsgroup dataset.Experimental results show that in the aspect of topic semantic coherence and text classi-fication,the proposed DGPU-LDA outperform some of the state-of-the-art topic models.Meanwhile,these im-provements also indicate that our DGPU-LDA have great power in text semantic feature representation.%当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能.但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限.该文提出了一个基于双向LSTM语义强化的概率主题模型DGPU-LDA(double generalized polya Urn with LDA).该模型一方面结合双向LSTM文档语义编码框架DS-Bi-LSTM(document semantic bi-directional LSTM)来实现文档宏观语义的嵌入表示,另一方面采用文档-主题和词汇-词汇双GPU(generalized polya Urn)语义强化机制以及LSTM来刻画参数推断过程中的吉布斯采样过程.在搜狗新闻数据集以及20新闻组数据集上的实验结果表明,相对于一些比较前沿的主题模型,DGPU-LDA模型在主题语义连贯性、文本分类准确率方面展现了一定的优势,同时该模型在文本语义特征表达方面的有效性也得到了证明.

著录项

来源
《中文信息学报》 |2018年第4期|40-49|共10页
作者
彭敏; 杨绍雄; 朱佳晖;
展开▼
作者单位

武汉大学计算机学院,湖北武汉 430072;

武汉大学计算机学院,湖北武汉 430072;

武汉大学计算机学院,湖北武汉 430072;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
双向LSTM; 语义强化; 主题模型;

相似文献

中文文献
外文文献
专利

1. 基于动态语义编码双向LSTM的中文语义相似度计算 [J] . 初雅莉 ,郑虹 ,侯秀萍 . 计算机应用与软件 . 2020,第006期
2. 多主题下基于LSTM语义关联的长文本过滤研究 [J] . 曹春萍 ,武婷 . 计算机技术与发展 . 2019,第011期
3. 融合多层注意力机制与双向LSTM的语义关系抽取 [J] . 周文烨 ,刘亮亮 ,张再跃 . 软件导刊 . 2019,第007期
4. 融合多层注意力机制与双向LSTM的语义关系抽取 [J] . 周文烨1 ,刘亮亮2 ,张再跃1 . 软件导刊 . 2019,第007期
5. 实体驱动的双向LSTM篇章连贯性建模 [J] . 杜舒静 ,徐凡 ,王明文 . 中文信息学报 . 2017,第006期
6. 基于双向LSTM语义强化的主题建模 [C] . 彭敏 ,杨绍雄 ,朱佳晖 . 第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 . 2017
7. 基于知识图谱语义扩展的短文本主题建模研究 [A] . 赵东伟 . 2020

基于双向LSTM语义强化的主题建模

摘要

著录项

相似文献

相关主题

期刊订阅