首页> 中文学位 >一种基于TSVM的phishing网页检测方法
【6h】

一种基于TSVM的phishing网页检测方法

代理获取

摘要

网络钓鱼(Phishing)是指欺诈者通过模拟相同或相似的Web页面或网站,假冒合法者身份,窃取个人信息或隐私信息,从而获得非法政治经济利益。随着phishing的危害越来越严重,phishing网页检测作为一种反钓鱼措施与技术受到普遍的关注和重视。本文提出一种基于直推支持向量机(Transductive Support Vector Machine,TSVM)的phishing网页检测方法,在分析网页内容特征的基础上,用TSVM模型分类检测识别phishing网页。
   首先,针对DOM(Document Objects Model)模型网页文档特征的局限性,论文增加提取网页图像特征。论文将量子进化算法,克隆变异操作引入谱聚类图像分割领域,实现对网页图像的精确分割。根据网页图像分割结果提取其子图形状,灰度直方图,彩色直方图及空间位置关系特征。然后根据网页DOM模型,提取URL信息,链接对象,表单元素,SSL证书信息等异常文档页面特征。其次,由于组成网页特征向量的数据元素格式不同,存在冗余,phishing网页分类器在处理其大量网页特征数据时,需要花费较长时间。为了解决效率问题,论文引入核主成分分析(Kernel Principal Component Analysis,KPCA)对前面生成的网页特征向量进行规格化降维处理,使之符合phishing网页分类器的输入要求。最后,针对支持向量机(Support Vector Machine,SVM)利用已知标签样本训练分类器模型,不能全部反映样本数据空间分布特性的不足,论文引入TSVM半监督学习方法,基于降维后的网页特征向量,分类识别phishing网页。TSVM分类器包含了未知标签样本的隐含分布信息,具有更好的泛化性能。实验证明,论文提出的基于TSVM的phishing网页检测方法在提高phishing网页检测率,降低误判率等方面有较大改进,作为独立的检测机制有较强的适用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号