首页> 中文期刊> 《情报学报》 >基于LDA的社会化标签综合聚类方法

基于LDA的社会化标签综合聚类方法

         

摘要

社会化标注系统产生了大量歧义的、不受控制的标签,不仅会降低用户的体验,而且会限制资源的利用效率.标签聚类能够把具有相近语义的标签聚集在一起,反映标签的潜在语义结构,从而有效缓解上述问题.传统的标签聚类方法通常只利用资源的被标注信息进行聚类,由于忽略了用户的标注信息使得聚类结果不能表达准确的语义.本文提出一种基于LDA (Latent Dirichlet Allocation)模型的社会化标签综合聚类方法,该方法分别利用用户的标注信息和资源的被标注信息来建立主题学习模型,通过学习,获取基于用户的标签潜在主题和基于资源的标签潜在主题,综合标签在这两类主题上的概率分布结果,建立标签主题的二次学习模型,学习出标签的混合主题并在此基础上判定标签的聚类簇.与传统方法相比,本文的方法不仅可以有效地利用标签之间的语义关系,而且能够在一定程度上缓解传统标签聚类方法所面临的高维和稀疏性问题.实验结果表明,本文的方法具有较好的效果.

著录项

  • 来源
    《情报学报》 |2015年第2期|146-155|共10页
  • 作者单位

    合肥工业大学计算机与信息学院;

    合肥230009;

    安徽理工大学经济与管理学院;

    淮南232001;

    合肥工业大学计算机与信息学院;

    合肥230009;

    合肥工业大学计算机与信息学院;

    合肥230009;

    安徽省科学技术情报研究所;

    合肥230001;

    合肥工业大学计算机与信息学院;

    合肥230009;

    闽南师范大学计算机学院;

    漳州 363000;

    合肥工业大学计算机与信息学院;

    合肥230009;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    社会化标注系统; 标签聚类; 潜在语义; 主题模型;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号