首页> 外文会议>Proceedings of the 77th ASISamp;T annual meeting, Connecting collections, cultures, and communities >Exploring Topics in the Field of Data Science by Analyzing Wikipedia Documents: A Preliminary Result
【24h】

Exploring Topics in the Field of Data Science by Analyzing Wikipedia Documents: A Preliminary Result

机译:通过分析Wikipedia文档探索数据科学领域的主题:初步结果

获取原文
获取原文并翻译 | 示例

摘要

In this poster, topics in the field of Data Science werernexplored from Wikipedia documents based on clustering,rnprincipal component analysis (PCA), and topic modeling.rnAs a pilot study, we analyzed part of the dataset ofrnWikipedia documents to initially identify topics discussedrnin Data Science. Hierarchical clustering resulted in sixrnclusters of topics while PCA identified eleven dimensionsrnin the Data Science field. In addition, topic modeling basedrnon latent Dirichlet allocation (LDA) produced fifty topicsrnrelated to Data Science. The researchers plan to furtherrnexamine hierarchical, structural relationships betweenrntopics using structural equation modeling and socialrnnetwork analysis. The findings from this study will bernuseful to understand what topics are currently discussed inrnthe area of Data Science.
机译:在此海报中,基于聚类,主成分分析(PCA)和主题建模从Wikipedia文档中探索了数据科学领域的主题。作为试点研究,我们分析了Wikipedia文档的数据集的一部分,以初步确定数据科学中讨论的主题。 。层次聚类产生了六个主题集群,而PCA在数据科学领域确定了11个维度。此外,基于主题模型的非潜在狄利克雷分配(LDA)产生了与数据科学相关的五十个主题。研究人员计划使用结构方程建模和社交网络分析进一步研究主题之间的层次结构关系。这项研究的结果对于了解数据科学领域当前正在讨论的主题将是无用的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号