首页> 中文期刊> 《情报理论与实践》 >中文博客标签的聚类及可视化研究

中文博客标签的聚类及可视化研究

         

摘要

文章选取科学网博文的两类标签为研究对象,用户生成标签和用TEXTRANK算法产成机器生成标签,对标签进行统计处理后生成各自的标签词典,根据标签词典用两种相似度计算方法(余弦向量法和欧式距离法)对标签进行相似度计算,用开源的AP聚类算法对两种不同来源的标签进行聚类,并使用可视化工具对聚类标签进行展示,最后对两种标签聚类结果进行了相应的比较和描述.研究发现,用户生成标签的聚类结果比机器生成标签的聚类结果要更分散,能够通过标签聚类发现一些主题.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号