Word和PDF文档的恶意性检测算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机网络的飞速发展，越来越多的人开始注重保护个人隐私及重要数据。各种恶意性文档的出现给人们工作和生活带来了巨大危害，其中，Microsoft Word和PDF等比较大众化的文档编辑和查看软件成为了攻击者的目标，各种恶意性攻击层出不穷，漏洞数量急剧上升，给人们造成了不可挽回的损失。若能针对可疑的Word和PDF文档，设计出快速有效的检测算法，这将在某种程度上大大遏制恶意性文档的危害。
　　针对上述问题，在研究Word和PDF文档安全性背景的基础上，分析了Word和PDF文档常见的攻击方式，阐述了目前的检测研究现状。已知的恶意程序检测系统中，动态检测的缺点是检测时间过长，静态检测的缺点是准确度不高。机器学习算法拥有对数据进行分析和建模的能力，可以挖掘蕴藏的统计规律，越来越多的安全领域研究者尝试使用它进行恶意程序检测。本文在已有研究方法的基础上，提出两种基于机器学习的快速有效的检测算法：
　　1)基于API行为特征和Inception V3模型的Word和PDF恶意性动态检测
　　沙箱技术是当前最常用的动态分析技术，但它是以时间开销和虚拟化指令系统为代价的。在改进的Cuckoo沙箱系统基础上，设计了一种基于深度学习模型GoogLeNet Inception V3的Word和PDF文档的恶意性动态检测算法。对改进的Cuckoo沙箱系统的文档运行结果根据API依赖关系进行抽象，得到文档的特征向量，再进行维度转换，以二维特征作为算法的输入。Inception V3网络会提取每幅二维图像的Bottleneck特征，接着采用迁移学习的方法训练分类器，最后实现文档的恶意性动态检测。实验证明，该算法在对未知Word和PDF文档的恶意性检测上取得了较好的时间性能，而且检测率达到了89.1％。
　　2)基于K-means和深度文本特征检测网络的PDF恶意性静态检测
　　传统的PDF文档静态检测一般是针对于某种特定的攻击方式，而且检测率较低。针对这些问题，设计了一种 PDF文档的恶意性静态检测算法，它包括两个方面：基于K-means的区别性文本特征的提取和基于深度文本特征检测网络的算法分类。通过PDF解析工具PDFMiner和K-means聚类算法提取到恶意和正常PDF的区别性文本特征，作为算法的输入；深度文本特征检测网络是一种设计的15层的深度线性神经网络结构。实验证明，该算法对未知 PDF文档的恶意性检测率达到了86.6%，而且可以有效处理不同攻击方式下的恶意性PDF文档的检测问题。

著录项

作者
田小娣;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机技术
授予学位硕士
导师姓名苗启广,钟升;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;安全保密;
关键词
恶意性文档; 深度学习; 检测算法; 安全性; 文本特征;

相似文献

中文文献
外文文献
专利

1. 基于文档图结构的恶意PDF文档检测方法 [J] . 俞远哲 ,王金双 ,邹霞 . 信息技术与网络安全 . 2021,第011期
2. 基于特征集聚和卷积神经网络的恶意PDF文档检测方法 [J] . 俞远哲 ,王金双 ,邹霞 . 信息技术与网络安全 . 2021,第008期
3. 基于特征集聚和卷积神经网络的恶意PDF文档检测方法 [J] . 俞远哲 ,王金双 ,邹霞 . 微型机与应用 . 2021,第008期
4. 基于混合特征的恶意PDF文档检测 [J] . 杜学绘 ,林杨东 ,孙奕 . 通信学报 . 2019,第002期
5. 恶意PDF文档检测技术研究进展 [J] . 林杨东 ,杜学绘 ,孙奕 . 计算机应用研究 . 2018,第008期
6. 基于结构特征的恶意PDF文档检测 [C] . Li Lingxiao ,李玲晓 ,Wu Chunhua . 第十届中国通信学会学术年会 . 2014
7. 恶意PDF文档检测技术研究与实现 [A] . 冯迪 . 2017

Word和PDF文档的恶意性检测算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅