首页> 外文会议>NAFOSTED Conference on Information and Computer Science >Mining and Creating a Software Repositories Dataset
【24h】

Mining and Creating a Software Repositories Dataset

机译:挖掘和创建软件存储库数据集

获取原文

摘要

Mining software repositories to extract meaningful information from them has become an important topic in software engineering. This paper presents our study to mine a very large dataset consisting of over three million software repositories across many version control systems and create derived data for future studies. Through this study, we propose a method for detecting forks and duplicates in repositories. We also preliminarily investigate the possible correlations between forking patterns, software health and risks, and success indicators.
机译:挖掘软件存储库从他们中提取有意义的信息已成为软件工程中的一个重要主题。本文提出了我们的研究,可以挖掘一个非常大的数据集,包括在许多版本控制系统上超过三百万个软件存储库,并为未来的研究创建派生数据。通过本研究,我们提出了一种用于在存储库中检测叉子和重复的方法。我们还初步调查分叉模式,软件健康和风险以及成功指标之间的可能相关性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号