首页> 中文期刊> 《计算机应用与软件》 >基于LDA模型的微博话题发现技术研究

基于LDA模型的微博话题发现技术研究

         

摘要

微博中存在着数以亿计的用户,这些用户每天发布大量的信息。这些海量的微博信息给热点话题发现提出了严峻的挑战。应用LDA(Latent Dirichlet Allocation)模型对微博中隐含的话题进行建模,利用话题间的共享词汇将话题构成一个无向加权图,并通过PageRank算法将话题进行排名。实验结果表明,排名后返回给用户的话题的准确性明显高于未排名的结果。%There are tens of millions of users in microblogging,and they publish massive messages every day.These massive microblogging messages impose severe challenge to hot topics detection.In this paper we model the concealed topics in microblogging with LDA (latent Dirichlet Allocation)model,form the topics as an undirected weighted graph by utilising the sharing words among the topics, and rank the topics in the graph with PageRank algorithm.Experimental results show that the topics returned to users after the PageRank ranking is more accurate than that of non-ranking.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号