首页> 中文学位 >基于组合及统计的图像型垃圾邮件检测研究
【6h】

基于组合及统计的图像型垃圾邮件检测研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 研究背景

1.2 研究目的与意义

1.3 研究内容与结构

第二章 图像型垃圾邮件检测技术综述

2.1 引言

2.2 垃圾图像

2.3 图像型垃圾邮件检测方法

2.4 评价指标

2.5 本章小结

第三章 基于统计分类器的图像型垃圾邮件检测

3.1 引言

3.2 图像型垃圾邮件的相似性检测

3.3 高斯混合模型分类器的提出

3.4 特征提取与优化

3.5 GMM分类器的设计

3.6 实验与讨论

3.7 本章小结

第四章 基于组合的图像型垃圾邮件检测

4.1 引言

4.2 传统的图像型垃圾邮件检测算法

4.3 堆栈组合分类模型的设计

4.4 实验与讨论

4.5 本章小结

第五章 总结与展望

5.1 论文完成的工作

5.2 未来的研究方向

致谢

攻读硕士学位期间发表的论文

攻读硕士学位期间获得的专利申请

缩略词

图表清单

参考文献

展开▼

摘要

随着物联网时代逐步到来,电子邮件仍然是最重要的沟通工具之一。然而,其副产物——垃圾邮件的出现给人们的生活带来了潜在的危险。其中图像型垃圾邮件促使着反垃圾邮件技术进入一个新的研究领域。如何精确和高效地检测图像型垃圾邮件是急需解决的问题。
  论文系统地分析了图像型垃圾邮件的产生背景、发展现状及研究意义,提出了基于组合及统计分类器的图像型垃圾邮件的检测方法。论文的主要工作和贡献在于:
  (1)提出了利用SURF特征提取算法来提取图片的局部不变特征并使用统计学中的高斯混合模型来对图像的这种特征进行高斯混合分布的拟合。通过改进K-means均值聚类算法,以交叉熵作为高斯混合分布之间的距离计算标准,对数据集中图像的高斯混合模型进行聚类以减少实验的计算量,提高实验的效率。最终设计并实现了基于交叉熵的高斯混合模型分类器,通过实验验证,新提出的分类器具有较好的分类效果。
  (2)以往的图像型垃圾邮件过滤系统只针对图像的内容特征或者图像的文字特征,而容易丢失图像信息,导致分类的准确度不高。论文提出使用堆栈组合模型分类器结合了图像的文字特征与图像的内容特征,充分利用了图像所携带的数据信息,特别地,针对不同的图像特征使用不同的分类器进行分类,然后通过多层次组合得出一个综合的结果。通过多种实验验证,发现使用堆栈组合模型综合图像的文字及内容特征能够获得更高的分类精确度及召回率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号