Mining and Creating a Software Repositories Dataset

机译：挖掘和创建软件存储库数据集

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Mining software repositories to extract meaningful information from them has become an important topic in software engineering. This paper presents our study to mine a very large dataset consisting of over three million software repositories across many version control systems and create derived data for future studies. Through this study, we propose a method for detecting forks and duplicates in repositories. We also preliminarily investigate the possible correlations between forking patterns, software health and risks, and success indicators.

机译：挖掘软件存储库从他们中提取有意义的信息已成为软件工程中的一个重要主题。本文提出了我们的研究，可以挖掘一个非常大的数据集，包括在许多版本控制系统上超过三百万个软件存储库，并为未来的研究创建派生数据。通过本研究，我们提出了一种用于在存储库中检测叉子和重复的方法。我们还初步调查分叉模式，软件健康和风险以及成功指标之间的可能相关性。

著录项

来源
《NAFOSTED Conference on Information and Computer Science》|2020年|78-83|共6页
会议地点
作者
Thai-Bao Do; Huu-Nghia H. Nguyen; Bao-Linh L. Mai; Vu Nguyen;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Measurement; Time-frequency analysis; Correlation; Control systems; Software; Data mining; Software engineering;

机译：测量;时间频率分析;相关;控制系统;软件;数据挖掘;软件工程;

相似文献

外文文献
中文文献
专利

1. A Semi‐automated Approach to Create Purposeful Mechanistic Datasets from Heterogeneous Data: Data Mining Towards the in silico in silico Predictions for Oestrogen Receptor Modulation and Teratogenicity [J] . Bashir?Surfraz M., Fowkes Adrian, Plante Jeffrey P. Molecular informatics . 2017,第8期

机译：从异质数据创建有目的地机械数据集的半自动方法：雌激素预测中的硅化的数据挖掘雌激素受体调节和致畸性
2. Creating Reference Datasets for Systems Biology Applications Using Text Mining [J] . Martin Krallinger, Ana Maria Rojas, Alfonso Valencia Annals of the New York Academy of Sciences . 2009,第期

机译：使用文本挖掘为系统生物学应用程序创建参考数据集
3. Mining software repositories for empirical validation of laws of software evolution for Java projects [J] . Arvinder Kaur, Vidhi Vig International journal of computational systems engineering . 2016,第3期

机译：挖掘软件存储库以对Java项目的软件演化定律进行经验验证
4. Creating and Analyzing Source Code Repository Models: A Model-based Approach to Mining Software Repositories [C] . Markus Scheidgen, Martin Smidt, Joachim Fischer International Conference on Model-Driven Engineering and Software Development . 2017

机译：创建和分析源代码存储库模型：基于模型的挖掘软件存储库方法
5. Analysing source code structure and mining software repositories to create requirements traceability links [D] . Ali, Nasir 2012

机译：分析源代码结构和挖掘软件存储库以创建需求可追溯性链接
6. Easily created prediction model using deep learning software (Prediction One Sony Network Communications Inc.) for subarachnoid hemorrhage outcomes from small dataset at admission [O] . Masahito Katsuki, Yukinari Kakizawa, Akihiro Nishikawa, 2020

机译：使用深度学习软件（预测一索尼网络通信Inc.）轻松创建预测模型用于在入院中的小型数据集的蛛网膜下腔出血结果
7. Project Creates Repository for Microarray Datasets [O] . S. L. Zielinski 2004

机译：项目为微阵列数据集创建存储库

Mining and Creating a Software Repositories Dataset

摘要

著录项

相似文献

相关主题

期刊订阅