首页> 外文OA文献 >Design and Implementation of Hot Topics Discovery System Based on Micro-Blog
【2h】

Design and Implementation of Hot Topics Discovery System Based on Micro-Blog

机译:基于微博的热点话题发现系统的设计与实现

摘要

微博已经成为当今社会新一代的媒体标志,因其短暂的发展历程所展现的迅猛之态,引发了众多学者的研究热情。如何在海量微博文本中更快更精确地挖掘数以亿计的用户所讨论的热点话题,具有较强的社会意义和现实意义,因而成为了许多学者们关注的焦点,能够实现对舆论的监控与引导,达到新闻发布的针对性目标。 本文首先采用基于分隔符的方法采集微博原始数据,之后采用具有优秀降维能力,且能挖掘文本潜在语义的LDA模型发现微博文本集中隐含的话题。原始LDA模型需要人为设定话题的个数,难以应用于真实微博数据中。为了能够自适应识别话题数目,本文提出了LDA_C模型,该模型在原始LDA模型中引入了文本聚类的方法。此外,为了较好地...
机译:微博已经成为当今社会新一代的媒体标志,因其短暂的发展历程所展现的迅猛之态,引发了众多学者的研究热情。如何在海量微博文本中更快更精确地挖掘数以亿计的用户所讨论的热点话题,具有较强的社会意义和现实意义,因而成为了许多学者们关注的焦点,能够实现对舆论的监控与引导,达到新闻发布的针对性目标。 本文首先采用基于分隔符的方法采集微博原始数据,之后采用具有优秀降维能力,且能挖掘文本潜在语义的LDA模型发现微博文本集中隐含的话题。原始LDA模型需要人为设定话题的个数,难以应用于真实微博数据中。为了能够自适应识别话题数目,本文提出了LDA_C模型,该模型在原始LDA模型中引入了文本聚类的方法。此外,为了较好地...

著录项

  • 作者

    陈晶晶;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种 zh_CN
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号