首页> 中文学位 >基于特征选择分类和双向LSTM神经网络的钓鱼网站检测
【6h】

基于特征选择分类和双向LSTM神经网络的钓鱼网站检测

代理获取

目录

第一个书签之前

展开▼

摘要

时代的进步和网络技术的发展为我们生活带来便利的同时,也伴随着一些信息安全问题。网络钓鱼是一种典型的欺骗用户获取敏感信息的手段,这种有着极大经济利润的攻击手段频繁发生,使网络间人与人之间的信任变得脆弱,阻碍了网络贸易的正向发展。由此可见,如何准确高效地检测钓鱼网站成为网络信息安全的研究热点。 基于机器学习的钓鱼网站检测技术是网络钓鱼研究的热点技术,该方法的关键点在于特征的构建和分类算法的选择。本文首先对钓鱼网站相关特征进行了深入研究,对爬取的两万条URL样本(正反例各半)进行统计分析,不仅包括URL、HTML等常用特征,还爬取了WHOIS信息和ALEXA信息,通过特征选择构建了一个高效的特征组合,利用机器学习算法进行分类对比。经过实验验证,随机森林能较好的区分钓鱼网站。 钓鱼网站存活时间短且变化形式多样,人工提取特征往往依赖于人的先验知识,针对上述研究机制中,一些常用的URL特征不能有效区分新钓鱼网站以及多类特征融合的钓鱼网站检测方法效率低下等不足,提出了一种利用神经网络学习URL序列的钓鱼网站检测机制。利用双向LSTM 可以学习序列化特征及长期依赖关系的特性,捕捉URL序列之间隐含的依赖关系,并用于钓鱼网站识别任务。 本文提出将URL文本转换为词向量,然后将带正反例标签的训练数据送到神经网络模型中,通过逆向传播算法训练分类模型,再通过交叉验证的方法对模型的性能进行验证比较,实验结果表明本文提出的方法确实提高了钓鱼网站检测的准确率和查全率,同时有效降低了误报率和漏报率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号