Web应用中基于树的克隆代码检测方法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

克隆代码又叫做代码克隆，往往是由开发人员的“拷贝-粘贴”行为导致的。在软件维护周期，开发过程中所引入的克隆代码会导致昂贵的维护费用。研究表明在传统软件中，克隆代码占到了软件源代码的13％-20％。随着Web技术的发展，越来越多的Web应用被开发并且在用户中流行。由于Web开发本身的一些特点，不管在新开发的还是稳定版本的Web应用中都存在克隆代码，相比于传统软件，克隆代码的比例甚至更加高。但是目前针对Web应用中克隆代码的检测研究较少，且大多数都是使用基于哈希值的方法来检测克隆代码。使用基于哈希值的方法意味着许多克隆代码会被漏掉，以及精度上的问题。
　　本文在相关的研究基础上，总结各种检测方法的优缺点，构建并改进了基于树的克隆代码检测方案，并实现了基于树的克隆代码检测系统TCD(Tree-basedCloneDetection)。该方案中改进并使用特征向量代替子树，以降低子树匹配所带来的开销。通过对特征向量的分析，引入了降低特征向量的维度的方法，从而减少了高维向量所带来的计算开销。引入建立特征向量的随机kd森林的索引来高效地查找每个特征向量的最邻近特征向量以得到克隆代码，从而保证了检测克隆代码的高效性以及准确性。通过对14个最流行的Web应用进行克隆代码的检测，统计每个Web应用中的克隆率并统计和分析结果中各种类型的克隆代码分布的情况。并选取其中三个应用的三个不同版本，统计同一应用的不同版本中的克隆率。最后，在不同应用中也检测到了克隆代码。
　　大量的实验表明，TCD在大多数情况下，能够高效地检测三种类型的克隆代码。并且相对于现有的克隆代码检测工具，TCD在速度上、精度以及检测的克隆代码数量上都有一定的优势。

著录项

作者
李超群;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科计算机科学与技术
授予学位硕士
导师姓名孙建华;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.52;
关键词
Web应用; 克隆代码检测方法; 解析树; 特征向量; TCD技术;

相似文献

中文文献
外文文献
专利

1. Web应用中冗余代码检测方法研究 [J] . 胡营营 ,赵逢禹 . 计算机技术与发展 . 2020,第003期
2. 软件源代码中的代码克隆现象及其检测方法 [J] . 叶青青 . 计算机应用与软件 . 2008,第009期
3. 基于Word2vec的克隆代码检测方法研究 [J] . 贾清 ,杨抒 . 计算机技术与发展 . 2020,第008期
4. 基于抽象语法树的C克隆代码重构应用与研究 [J] . 辛艳艳 ,吴海涛 . 上海师范大学学报（自然科学版） . 2018,第004期
5. 基于后缀树的相似代码检测方法的研究 [J] . 禤静 . 信息通信 . 2016,第010期
6. 基于扩展攻击树的恶意代码检测方法 [C] . Zheng Qiusheng ,郑秋生 ,Shi Yunfeng . 河南省计算机学会2011年学术年会 . 2011
7. TECCD：基于树嵌入的代码克隆检测方法 [A] . 高毅 . 2019

Web应用中基于树的克隆代码检测方法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅